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内 容 简 介 

本 书 主 要 提供 Java 性 能 调 优 方面 的 参考 建议 及 经 验 交 流 。 作 者 力 
求 做 到 知识 的 综合 传播 ， 而 不 是 仅仅 只 针对 Java 虚 拟 机 调 优 进行 讲 
解 ， 另 外 力求 每 一 章节 都 有 实际 的 案例 支撑 。 具 体 包括 : 性 能 优化 策 
略 、 程 序 编写 及 硬件 服务 器 的 基础 知识 、Java API 优 化 建议 、 算 法 类 
程序 的 优化 建议 、 并 行 计算 优化 建议 、Java 程 序 性 能 监控 及 检测 、 
JVM 原 理 知识 、 其 他 相关 优化 知识 等 。 

通读 本 书后 ， 读 者 可 以 深入 了 解 Java 性 能 调 优 的 许多 主题 及 相关 
的 综合 性 知识 。 读 者 也 可 以 把 本 书 作为 参考 ， 对 于 感 兴 趣 的 主题 ， 直 
接 跳 到 相应 章节 寻找 答案 。 

总 的 来 说 ， 性 能 调 优 在 很 大 程度 上 是 一 门 艺术 ， 解 决 的 Java 性 能 
问题 越 多 ， 技 艺 才 会 越 精湛 。 我 们 不 仅 要 关心 JVM 的 持续 演进 ， 也 要 
积极 地 去 了 解 底层 的 硬件 平台 和 操作 系统 的 进步 。 


未 经 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 之 部 分 或 全 部 内 容 。 
版 权 所 有 ， 侵 权 必 究 。 
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最 大 的 思想 亲 乱 是 相信 人 们 想 要 相信 的 事情 。 

一 一 路 易 斯 : 巴 斯 德 (Louis Pasteuer) 

Michael 周 是 个 具有 丰富 程序 经 历 的 架构 师 和 项 目 管理 者 ， 他 从 国 
内 作坊 式 的 软件 开发 公司 起 步 ， 经 历 了 著名 的 咨询 公司 凯 捷 的 欧洲 工 
作 洗 礼 ， 后 来 于 美国 花旗 软件 担任 高 级 软件 技术 总 监 ， 平 时 常常 思考 
和 总 结 21 世 纪 以 来 我 国 软件 开发 者 ， 特 别 是 Java 开 发 工程 师 的 困惑 。 

我 们 通常 情况 下 ， 一 开始 可 以 有 条 不 亲 地 进行 软件 需求 定义 和 分 
析 ， 随 着 上 线 时 间 的 不 断 追 近 ， 面 对 客户 的 吊 吊 逼 人 的 需求 修改 和 即 
刻 变 更 需求 上 线 讨 力 ， 程 序 员 作 为 弱势 群体 ， 往 往 会 考虑 时 间 优 先 原 
则 ， 很 难 守住 按部就班 的 开发 计划 和 开发 方式 ， 从 而 导致 出 现 了 软件 
质量 的 大 幅度 下 降 。 软 件 一 定 存在 修改 的 余地 ， 但 是 程序 员 们 通常 不 
相信 自己 的 系统 存在 诸多 问题 ， 尤 其 是 感觉 自己 已 经 做 得 相当 完美 。 
系统 调 优 在 软件 的 后 续 改 进 和 重 构 中 占有 很 大 的 地 位 ， 能 够 弥补 前 述 
的 不 足 ， 本 书 以 通俗 的 语言 和 引人入胜 的 故事 ， 重 总 讲述 软件 性 能 衣 
优 的 方法 论 和 具体 实现 路 径 ， 读 者 可 以 根据 自己 的 实际 情况 进行 参照 
比 对 ， 就 像 进 了 兵器 库 挑选 合适 自己 的 顺手 武器 。 

程序 凑合 着 上 线 是 一 回 事 ， 而 能 够 优美 地 运行 在 压力 下 往往 很 不 
容易 。 本 书 对 于 所 有 有 志 于 进行 软件 高 级 管理 的 人 员 而 言 ， 具 有 非常 
重要 的 意义 。 

海 适 云 承 CEO 兼 首席 架构 师 LX (Sam Shen) 
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7 岁 那 年 ， 当 我 舍 上 《上 下 五 千年 》 一 套 三 册 书 籍 时 ， 我 对 自己 
说 ， 我 想 当 个 作家 。 这 一 晃 27 年 了 ， 等 待 了 27 年 ， 我 的 第 一 本 书 《 大 
话 Java 性 能 优化 》 即 将 面世 了 。 我 是 多 么 的 志 起 、 惊 喜 ， 就 像 第 一 次 
面 对 我 的 女儿 “小 闫 子 ”， 给 她 取 这 个 小 名 ， 和 希望 她 顽强 到 底 ， 因 为 我 
相信 ， 你 若 奖 强 到 底 ， 一 切 省 有 可 能 。 

从 15 岁 拥有 自己 第 一 台电 脑 算 起 ， 已 经 有 接近 20 年 的 计算 机 学 习 
时 间 ， 加 上 11 年 的 工作 经 历 ， 我 对 于 工作 ， 对 于 工程 师 这 个 职业 ， 有 
一 些 自己 的 感悟 。 我 认为 ， 职 业 素养 非常 重要 。 

1929 年 ， 在 汪精卫 的 支持 下 ， 余 云 册 等 人 提出 了 全 面 废除 中 医 、 
茶 止 中 医 的 提案 ， 并 很 快 获得 初审 通过 。 在 这 样 的 局 面 下 ， 全 国 各 地 
中 医师 多 次 到 南京 请 愿 ， 虽 有 孙 科 等 人 的 支持 ， 但 反响 不 大 。 相 持 阶 
段 ， 无 独 有 偶 ， 汪 精 卫 的 岳母 身 患 痢疾 ， 西 医师 医治 无 效 ， 京 城 四 大 
名 医 之 一 的 施 今 墨 先 生 裔 然 赴 汪 府 。 施 今 墨 赁 脉 ， 每 言 必 中 ， 使 汪 精 
卫 的 岳母 心服 口服 ， 频 频 点 头 称 是 。 处 方 时 施 今 墨 说 :“ 安 心服 药 ， 一 
AM, AOE. ABUL, ETA? RABE. Halki IER 
数 剂 ， 果 如 施 今 墨 所 言 。 汪 精 卫 不 得 不 服 中 医 ， 最 终 撤回 提案 。 施 老 
先生 医德 高 尚 ， 死 后 遗体 都 捐献 出 来 供 科学 研究 ， 绝 不 是 阿 讷 奉承 之 
人 ， 他 赴 汪 府 ， 完 全 是 因为 对 中 医生 这 个 职业 的 尊重 ， 为 了 让 人 知道 
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佛教 五 戒 之 一 的 不 妄 语 ， 要 求 我 们 不 欺骗 他 人 、 不 在 不 清 芭 实 际 
情况 的 时 候 胡 乱 说 话 ， 放 到 职场 ， 也 可 以 加 上 信息 安全 的 要 求 。 

《 越 绝 书 》 载 文 种 述 九 术 时 说 :“ 故 日 九 者 勿 患 ， 戒 口 和 勿 传 ， 以 取 
天 下 不 难 ， 况 于 吴 乎 ? ” 文 种 希望 勾践 秘 而 不 宣 ， 以 免 人 多 口 杂 ， 港 露 
机 密 。 每 个 人 都 有 自己 的 岗位 、 职 责 ， 我 们 要 做 的 是 做 好 自己 的 事 
情 ， 不 对 不 属于 自己 工作 荡 围 内 的 事情 评价 、 传 播 ， 不 在 背后 说 同事 
的 坏话 。 作 为 一 名 技术 人 员 ， 如 果 不 能 做 到 戒 口 、 静 心 、 专 心 ， 那 我 
觉得 你 应 该 尽早 转行 ， 你 不 适合 ， 也 绝 不 会 成 为 一 名 技术 大 拿 。 


气 场 

一 位 职业 的 工作 者 ， 他 身上 有 一 种 称 为 气 场 的 东西 存在 。 人 的 和 气 
场 是 看 不 见 的 ， 但 这 种 力量 是 巨大 的 ， 就 像 万 有 引力 一 样 ， 我 们 每 个 
人 身上 的 这 种 气 场 无 时 无 刻 不 在 影响 你 的 人 生 。 这 种 气 场 的 行程 与 你 
的 观念 、 信 仰 、 环 境 、 有 朋友、 呼吸 、 事 物 、 欲 望 、 静 息 与 睡眠 相关 。 
一 个 人 的 气质 很 好 ， 外 表 精 神 、 有 修养 、 有 道德 ， 这 个 人 的 气 场 就 
好 ， 就 会 吸引 好 的 事 ， 吸 引 好 的 运气 。 每 个 人 都 会 遇 到 各 种 各 样 的 苦 
难 ， 但 是 我 坚信 ， 你 若 顽强 到 底 ， 一 切 凡 有 可 能 。 

教养 

看 不 见 的 教养 很 难 。 在 乌 合 之 众 中 谁 能 保持 优雅 和 教养 ? 在 群体 
无 意识 中 谁 能 保持 清醒 和 判断 ? 更 难 的 是 那些 “慎独 ”的 教养 。 日 本 有 
一 种 文化 ， 叫 作 * 不 给 别人 添 麻烦 ”的 文化 ， 我 们 每 个 人 在 做 事 之 前 都 
应 该 考虑 是 否 自己 的 行为 会 给 别人 造成 麻烦 。 教 养 不 是 道德 规范 ， 也 
不 是 小 学 生 行 为 准则 ， 其 实 也 并 不 跟 文化 程度 、 社 会 发 展 、 经 济 水 平 
挂钩 ， 它 更 是 一 种 体谅 ， 体 谅 别 人 的 不 容易 ， 体 谅 别 人 的 处 境 和 习 
惯 。 对 于 教养 ， 我 个 人 的 理解 是 ， 谦 逊 是 一 种 教养 ， 自 尊 更 是 。 

心态 

尼克 : 胡 哲 说 过 ， 人 们 经 常 埋怨 什么 也 做 不 来 ， 但 如 果 我 们 只 记 挂 
着 想 拥有 或 欠缺 的 东西 ， 而 不 去 珍惜 所 拥有 的 ， 那 根本 改变 不 了 问 
题 ! 真正 改变 命运 的 ， 并 不 是 我 们 的 机 遇 ， 而 是 我 们 的 态度 。 

一 个 人 的 心态 很 是 重要 ， 心 量 小 的 人 ， 芝 麻 大 小 的 事情 也 能 在 心 
里 翻 江 倒 海 。 心 量 大 的 人 ， 即 使 在 危机 面前 也 能 镇 静 自 若 。 同 样 一 件 
事情 ， 掀 起 的 波澜 大 小 却 因 人 而 异 。 有 一 句 话 很 好 ， 用 于 技术 人 员 我 
觉得 尤其 合适 , “ 想 要 成 为 一 棵 大 树 ， 就 不 要 去 和 草 争 ”。 

一 个 人 的 成 就 ， 不 得 以 金钱 衡量 ， 而 是 一 生 中 ， 你 善待 过 多 少 
人 ， 有 多 少 人 怀念 你 。 成 功 并 非 单 指 事业 ， 无 论 是 爱好 或 职业 上 的 成 
功 都 只 是 成 就 。 成 功 应 该 是 多 元 化 的 ， 如 人 的 一 生 包 含 了 很 多 追求 一 
样 ， 而 非 单 一 指向 。 然 后 ， 无 论 你 多 有 成 就 ， 真 正 的 成 功 ， 就 是 陪伴 
家 人 。 所 有 的 情感 都 是 需要 陪伴 的 ， 这 些 陪伴 成 为 一 个 个 美好 的 回 
忆 ， 这 些 都 是 整个 家 庭 最 宝贵 、 最 重要 的 财富 ， 这 些 远 远 超越 物质 的 
重要 性 。 在 中 国 ， 因 为 价值 观 相对 比较 单一 ， 社 会 显得 很 浮躁 、 很 物 


质 ， 所 以 大 多 以 物质 的 追求 为 主 ， 越 多 越 好 ， 内 心 也 想 过 美好 的 生 
活 。 但 当 你 的 心 完 全 趋向 金钱 的 时 候 ， 很 多 美好 的 东西 就 会 自动 屏 节 
了 ， 不 会 出 现在 生活 中 。 别 让 忙碌 空白 了 回忆 。 

此 外 ， 作 为 一 名 技术 人 员 ， 我 觉得 ， 职 业 生 兰 中 可 能 很 多 次 需要 
面 对 工 作 的 变换 、 角 色 的 变化 ， 有 很 多 知识 需要 学 习 ， 所 以 ， 我 们 应 
该 把 * 归 零 ” 当 成 一 种 生活 的 新 单 态 。 

劝 学 

我 觉得 有 一 句 话 总 结 得 特别 好 , “能 干 工作 、 干 好 工作 是 职场 生存 
的 基本 保障 ”。 

荀子 是 颂 家 八 派 中 一 派 的 创始 人 ， 其 思想 学 说 以 儒家 为 本 ， 兼 采 
道 、 法 、 名 、 墨 诸 家 之 长 。 和 角子 在 他 的 著作 《 劝 学 》 一 文中 这 样 写 
道 , “君子 日 : 学 不 可 以 已 。 青 ， 取 之 于 赣 ， 而 青 于 蓝 ; 冰 ， 水 为 之 ， 
而 罕 于 水 。” 这 上 段 文字 大 体 表达 了 学 习 是 不 可 以 停止 的 ， 君 子 广泛 学 习 
并 且 每 天 反省 自己 ， 就 会 明白 道理 , 行为 上 也 不 会 有 什么 过 错 。 

原 浙 江 工业 大 学 浙 商 创新 发 展 研究 院 院 长 程 惠 芳 认 为 全 球 成 功 的 
科技 型 企业 ， 无 论 是 微软 的 比尔 : 盖 菊 ， 还 是 苹果 的 乔布斯 ，Facebook 
的 扎 克 伯 格 ， 无 一 不 是 技术 专家 ， 创 新 型 企业 必须 由 这 样 的 企业 家 带 
队 ， 懂 技术 ， 就 会 站 在 前 治 。 对 于 大 型 科技 企业 而 言 ， 光 懂 技 术 不 
够 ， 还 要 懂 市 场 。 

诸葛 亮 在 给 他 的 儿子 写 的 著名 的 《 诚 子 书 》 中 指出 ， 宁 静 才 能 够 
修养 身心 ， 静 思 反 省 。 不 能 够 静 下 来 ， 则 不 可 以 有 效 地 计划 未 来 ， 而 
且 学 习 的 首要 条 件 ， 就 是 有 宁静 的 环境 。 审 愤 理 财 ， 量 入 为 出 ， 不 但 
可 以 摆脱 负债 的 困扰 ， 更 可 以 过 着 简朴 的 生活 ， 不 会 成 为 物质 的 奴 
隶 。 要 计划 人 生 ， 不 要 事 事 讲求 名 利 ， 才 能 够 了 解 目 己 的 志向 ， 要 静 
下 来 ， 才 能 够 细心 计划 将 来 。 学 习 需 要 专注 ， 平 静心 境 才能 事 半 功 
倍 。 学 习 的 过 程 中 ， 决 心 和 锅 力 非常 重要 ， 因 为 缺乏 了 意志 力 ， 就 会 
半途 而 废 。 拖 延 就 不 能 够 快速 地 掌握 要 点 。 时 光 飞 逝 ， 意 志 力 也 会 随 
着 时 间 消 磨 。 

归属 感 

每 个 足球 队 有 11 位 球员 在 球场 上 比赛 ， 估 计 最 不 引 人 注 目的 应 该 
是 守门 员 了 吧 ， 他 要 忍受 着 大 多 数 时 间 的 无 聊 ， 还 要 保持 着 警惕 。 当 


危机 发 生 时 ， 很 有 可 能 还 要 一 个 人 战斗 ， 需 要 勇敢 地 面 对 对 方 前 锋 ， 
唯一 的 目标 是 ， 绝 对 不 让 你 攻破 球门 。 我 们 很 多 时 候 可 能 也 是 如 此 ， 
苗 苦 人 奋斗， 当 解 决 了 某 个 问题 ， 或 是 帮助 公司 拿 到 某 个 招标 ， 我 们 都 
会 感到 自豪 感 、 成 就 感 ， 这 就 是 归属 感 ， 对 于 技术 领域 的 归属 感 。 

最 后 ， 自 我 介绍 一 下 ， 我 叫 周 明耀 ， 研 究 生 学 历 ，12 年 工作 经 
验 ，IBM 开 发 者 论坛 专家 作者 。 我 是 一 名 IT 技术 狂热 爱好 者 ， 一 名 业 
余 历史 研究 人 员 ， 一 名 顽 强 到 底 的 工程 师 。 我 推崇 技术 创新 、 思 维 创 
新 ， 对 于 新 技术 非常 热爱 。 

感谢 我 的 家 人 ， 和 谐 的 家 庭 帮 助 我 完成 了 这 本 书 ， 我 的 妻子 ， 她 
美丽 、 细 心 、 博 学 、 偶 尔 不 那么 温柔 ， 但 是 我 很 爱 她 。 我 的 小 顽 子 ， 
她 天 生 的 性 格 很 像 我， 希望 她 能 够 踏 踏实 实 做 人 人， 保持 创 新 精神 ， 平 
平安 安 、 健 健康 康 地 生活 下 去 。 感 谢 我 妻子 父母 、 我 的 父母 ， 他 们 帮 
我 照顾 小 孩 ， 我 才 有 时 间 编 写 此 书 。 感 谢 浙 江 省 特级 教师 、 杭 州 高 级 
化 学 老师 郑 克 良 老师 ， 郑 老师 的 一 句 “ 永 远 不 要 放弃 ”， 推 动 着 我 多 年 
的 发 展 。 感 谢 数 学 老师 张 老师 在 公开 场合 对 我 智商 的 褒奖 ， 第 一 次 收 
获 这 样 的 赞赏 ， 对 我 这 样 性 格 的 孩子 是 多 么 的 重要 ， 谢 谢 。 感 谢 王 芳 
同学 ， 因 为 你 的 插画 天 赋 ， 让 这 本 书 的 内 容 更 加 丰富 、 可 读 ， 不 要 忽 
视 了 自己 的 才华 ， 你 很 有 天 赋 。 

我 相信 这 本 书 不 是 终点 ， 它 是 麦克 叔叔 此 生 一 系列 技术 书籍 的 开 
端 ， 下 一 本 书籍 见 。 
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第 1 章 性 能 调 优 策略 概述 


2011 年 1 月 ， 新 加 坡 飞 往 杭州 的 航班 。 飞 行 持续 时 间 很 长 ， 大 约 6 
个 小 时 ， 坐 在 四 周 的 人 很 快 熟悉 了 ， 互 相 攀 谈 起 来 。 有 一 位 小 姑娘 ， 
十 六 七 岁 的 模样 ， 长 得 很 漂亮 ， 默默 地 坐 在 座位 上 。 热 心 的 阿姨 和 她 
攀谈 ， 问 起 她 的 情况 ， 她 带 着 疲倦 自我 介绍 起 来 ，“ 我 在 新 加 坡 念 初 
三 ， 那 所 学 校 一 点 都 不 好 ， 我 在 成 都 是 最 好 的 初中 毕业 的 ， 也 考 上 了 
成 都 最 好 的 高 中 ， 但 是 ， 我 的 父母 ， 他 们 一 定 要 我 来 新 加 坡 复读 初 
三 ， 让 我 考 新 加 坡 的 高 中 ， 我 一 点 都 不 喜欢 这 里 ， 这 里 的 同学 看 不 起 
我 们 这 些 大 陆 学 生 ， 经 常 上 课 找 大 陆 来 的 老师 麻烦 ， 经 常 辱 骂 我 们 ， 
我 烦 透 了 ! ! ! "对 ， 这 不 是 自我 介绍 ， 这 是 一 个 人 接近 奔 溃 边缘 的 歇 
斯 底 里 。 也 就 是 在 当时 ， 我 做 出 了 决定 ， 我 绝 不 会 让 我 的 女儿 这 样 远 
离 我 ， 一 个 人 在 很 年 幼 的 时 候 就 必须 独立 面 对 生活 的 困难 ， 绝 不 。 无 
论 她 的 父母 出 于 什么 原因 让 她 去 国外 念书 ， 我 所 看 到 的 ， 是 让 一 个 不 
适合 承受 压力 的 人 承担 了 巨大 的 压力 ， 这 就 是 本 书 的 编写 原因 。 在 这 
本 书 里 我 想 要 和 大 家 讨论 的 话题 是 基于 Java 语 言 的 性 能 优化 ， 我 们 不 
能 随意 地 给 出 性 能 优化 方案 ， 就 像 随意 指派 由 那 位 小 姑娘 来 完成 全 家 
的 未 来 方向 一 样 。 我 们 必须 经 过 严密 的 研究 、 测 试 及 验证 ， 明 确 造成 
性 能 瓶颈 真正 的 原因 后 才能 开始 着 手 ， 言 目地 行动 只 会 造成 不 必要 的 
损失 。 当 然 ， 如 果 系 统 架构 设计 得 很 好 ， 就 可 以 在 很 大 程度 上 避免 类 
似 事情 发 生 ， 这 不 是 本 书 的 主要 讨论 范围 。 

本 章 主要 介绍 和 解决 以 下 问题 ， 这 些 也 是 全 书 的 基础 : 

a 为 什么 需要 调 优 ， 这 是 您 阅读 本 书 的 依据 ， 只 为 需要 调 优 而 调 
优 。 

n 了 解 程序 性 能 的 各 项 指标 ， 包 括 物理 机 器 性 能 、 程 序 性 能 。 

m 性 能 调 优 分 类 方法 ， 包 括 调 优 方向 、 调 优 方法 、 调 优 层次 。 


1.1 为 什么 需要 调 优 


注意 ， 这 一 节 会 提 到 许多 技术 名 词 ， 本 着 让 Java 初 学 者 看 懂 本 书 
的 目的 ， 笔 者 尽量 第 一 时 间 做 出 注释 ， 如 有 遗漏 读者 可 以 阅读 后 续 章 
节 ， 均 有 详细 介绍 。 

经 历 了 多 年 的 发 展 ，Java 已 由 一 门 单纯 的 计算 机 编程 语言 ， 逐 渐 
演变 为 一 套 强 大 的 技术 体系 平台 。 根 据 不 同 的 技术 规范 ，Java 设 计 者 
们 将 Java 划 分 为 3 种 结构 独立 但 却 又 彼此 依赖 的 技术 体系 分 支 ， 分 别 是 
Java SE, Java EE 和 Java ME[1]， 其 中 Java EE 被 广泛 使 用 在 企业 级 领 
域 ， 除 了 包括 Java API 组 件 外 ， 还 扩充 有 Web 组 件 、 事 务 组 件 、 分 布 式 
组 件 、EJB 组 件 、 消 息 组 件 等 ， 并 持续 发 展 到 现在 。 综 合 Java EE 的 这 
些 技 术 ， 开 发 人 员 可 以 构建 出 一 个 具备 高 性 能 、 结 构 严 并 的 企业 级 应 
用 ， 并 且 Java EE 也 是 用 于 构建 SOA 架 构 的 首选 平台 。 

Java 的 持续 发 展 要 感谢 Google， 正 是 Google 将 Java 作 为 Android 操 
作 系 统 的 应 用 层 编 程 语言 ， 使 得 Java 可 以 在 PC 时 代 、 移 动 互联 网 时 代 
都 得 到 迅猛 发 展 ， 可 以 用 于 手持 移动 设备 、 肉 入 式 设 备 、 个 人 电脑 、 
高 性 能 的 集群 服务 器 或 大 型 机 。 

随 着 互联 网 业务 的 不 断 拓展 、 繁 荣 ， 越 来 越 多 的 系统 架构 开始 参 
照 互 联网 企业 的 系统 架构 方式 。 无 论 是 互联 网 、 物 联网 ， 还 是 传统 行 
业 的 软件 设计 ， 笔 者 认为 ， 任 何 技术 都 离 不 开 对 业务 需求 的 支撑 [2]， 
所 以 开始 展开 研究 程序 性 能 问题 之 前 ， 我 们 需要 先 了 解 系 统 业 务 逻 
辑 。 

铁道 部 的 12306[3] 网 站 一 直 被 全 国人 民 所 诉 病 ， 它 确实 存在 一 些 
问题 ， 但 是 这 些 看 似 简 单 的 问题 ， 其 背后 牵扯 着 复杂 的 系统 架构 设 
计 。 这 些 设 计 最 终 是 为 业务 需求 服务 的 ， 即 12306 的 职责 是 为 所 有 旅客 
的 需求 服务 的 ， 而 程序 员 设 计 的 程序 又 是 为 12306 服 务 的 ， 所 有 的 用 户 
体验 归 到 最 终 就 是 服务 意识 。 我 们 来 看 一 下 12306 的 业务 ，12306 需 
要 支持 海量 并 发 查询 ， 即 海量 用 户 同 时 查 时 间 、 查 车 次 、 查 座位 、 查 
铺位 。 此 外 ， 对 应 的 下 单 过 程 也 就 会 伴随 着 海量 并 发 的 数据 库 操作 。 
据说 ， 淘 宝 在 双 十 一 期 间 也 只 有 几 百 万 用 户 [4]， 而 春运 期 间 抢 购 火 车 
票 是 全 国人 民 的 统一 活动 ， 瞬 时 访问 数量 有 千 万 级 别 甚 至 是 亿 级 别 
的 。 据 说 12306 的 高 峰 访 问 是 10 亿 PV[5]， 这 些 访问 主要 集中 在 早 8 点 到 
10 点 ， 每 秒 PV 在 高 峰 时 上 千 万 [6]。 


再 来 看 看 其 他 的 业务 系统 。 奥 运 会 期 间 的 奥运 票务 系统 采用 抽奖 
的 方式 ， 这 样 的 业务 设计 让 系统 不 存在 先 来 先 得 抢购 需求 ， 由 于 是 事 
后 抽奖 ， 因 此 事前 只 负责 收集 信息 ， 所 以 不 需要 保证 数据 的 一 致 性 ， 
这 也 就 没有 高 强度 并 发 锁 [7] 的 需求 ， 很 容易 通过 水 平 扩展 方式 克服 性 
能 瓶颈 。B2C 网 站 一 般 实时 性 要 求 不 高 ， 比 如 下 单 ， 用 户 提交 订单 
后 ， 订 单 并 不 是 马上 被 处 理 的 ， 而 是 等 待 一 定时 间 后 ， 用 户 才 会 收 到 
订单 是 否 确 认 的 通知 ， 这 样 就 确保 了 数据 不 需要 立即 被 处 理 ， 没 有 了 
效 据 高 并 发 同步 的 需求 。 也 融 是 说 ， 在 高 并 发 要 求 下 的 数据 一 致 性 是 
通常 情况 下 的 性 能 瓶颈 点 ， 也 是 通常 意义 上 的 技术 难点 之 一 。 

前 面 提起 过 ， 高 并 发 情况 下 的 数据 高 度 实 时 一 致 性 需求 是 很 难 实 
现 的 。 对 于 一 个 网 站 来 说 ， 并 发 浏览 网 页 造成 的 高 负载 较 容 易 处 理 ， 
高 并 发 的 查询 负载 也 可 以 处 理 ， 但 是 实时 下 单 是 最 难处 理 的 ， 因 为 下 
单 需要 访问 当前 的 库存 量 ， 对 于 12306 网 站 来 说 ， 库 存量 就 是 指 火车 票 
的 库存 ， 由 于 这 是 一 个 全 国联 网 系统 ， 所 以 可 以 预见 库存 量 保持 数据 
一 致 性 的 难度 。 据 说 苹果 CEO 库 克 [8] 正 是 因为 处 理 好 了 库存 问题 才 
得 以 继任 乔 帮主 [9] 的 宝座 。 目 前 来 看 ， 很 多 B2C[10] 网 站 的 下 单 都 是 
通过 异步 方式 来 实现 的 ， 这 样 的 做 法 可 以 避免 数据 高 度 一 致 性 要 求 。 

淘宝 模式 相 较 于 传统 B2C 网 站 有 一 个 优势 ， 即 它 不 需要 查询 库 
存 。B2C 网 站 拥有 自己 的 仓库 ， 每 次 下 单 前 ， 都 需要 查找 距离 客户 最 
近 的 仓库 是 否 有 库存 ， 这 样 的 计算 量 累 计 后 会 很 大 。 比 如 ， 你 在 上 海 
买 一 本 书 ， 如 果 上 海 附 近 的 仓库 没 货 ， 我 们 需要 先 计算 哪个 仓库 既 离 
上 海 最 近 又 有 这 本 书 。 淘 宝 网 站 由 于 本 身 商 业 模式 的 原因 ， 它 不 需要 
去 实时 检查 库存 ， 反 而 对 于 性 能 扩展 较为 容易 。 

的 确 我 们 可 以 通过 Nginx[11] 来 搞定 每 秒 10 万 的 静态 请 求 ， 只 要 有 
足够 的 网 络 融 宽 、 磁 盘 IO， 服 务 器 的 并 发 计算 能 力 够 强 ， 可 以 很 容易 
地 处 理 10 万 的 并 发 连接 。 但 是 如 果 我 们 引入 了 大 量 的 业务 逻辑 ， 那 就 
不 是 单纯 的 访问 问题 了 ， 该 解决 方案 也 束 成 了 浮云 。 

除了 业务 需求 、 程 序 运行 方式 之 外 ， 程 序 设 计 本 身 需 要 考虑 基础 
编程 技术 、 系 统 架 构 、 网 络 技术 、 操 作 系统 、 硬 件 服务 器 等 诸多 因 
素 。 计 算 机 专家 在 问题 求解 时 非常 重视 表达 式 简 洁 性 的 价值 。UNIX 的 
先驱 者 Ken Thompson[12] 曾 经 说 过 非常 著名 的 一 句 话 :“ 丢 弃 1000 行 代 
码 的 那 一 天 是 我 最 有 成 效 的 一 天 之 一 。” 这 对 于 任何 一 个 需要 持续 支持 


和 维护 的 软件 项 目 来 说 ， 都 是 一 个 当之无愧 的 目标 。 早 期 的 Lisp[13] 贡 
献 者 Paul Graham[14] 甚 至 将 语言 的 简洁 性 等 同 为 语言 的 能 力 。 这 种 对 
能 力 的 认识 让 我 们 把 编写 紧凑 、 简 洁 的 代码 作为 许多 现代 软件 项 目 选 
择 语言 的 首要 标准 。 

任何 程序 都 可 以 通过 重 构 代码 方式 去 除 多余 的 代码 或 无 用 的 占 位 
符 ， 例 如 空格 ， 删 除 空格 后 会 让 代码 变 得 更 加 简短 。 不 过 某 些 语言 天 
生 就 善于 表达 ， 也 就 特别 适合 于 简短 程序 的 编写 。APL 语 言 的 设计 理 
念 是 利用 特殊 的 图 形 符号 让 程序 员 用 很 少量 的 代码 就 可 以 编写 功能 强 
大 的 程序 。 这 类 程序 如 果实 现 得 当 ， 可 以 很 好 地 映射 成 标准 的 数学 表 
达 式 。 简 洁 的 语言 在 快速 创建 小 脚本 时 非常 高 效 ， 特 别 是 在 目的 不 会 
被 简洁 所 掩盖 的 简洁 明确 的 问题 域 中 。 

相 比 于 其 他 程序 设计 语言 ，Java 语言 的 见长 已 经 名 声 在 外 ， 主 要 
原因 是 由 于 程序 开发 社区 中 所 形成 的 惯例 。 在 完成 任务 时 ， 很 多 情况 
下 要 更 大 程度 地 考虑 描述 性 和 控制 能 力 。 例 如 ， 长 期 来 看 ， 长 变量 名 
会 让 大 型 代码 库 的 可 读 性 和 可 维护 性 更 强 。 描 述 性 的 类 名 通常 会 映射 
为 文件 名 ， 在 向 已 有 系统 中 增加 新 功能 时 会 显得 很 清晰 。 如 果 能 够 一 
直 坚 持 下 去 ， 描 述 性 名 称 可 以 极 大 简化 用 于 表明 应 用 中 某 一 特定 的 功 
能 的 文本 搜索 。 实 践 证 明 ， 这 些 定 义 方式 让 Java 在 大 型 复杂 代码 库 的 
大 规模 实现 中 取得 了 极 大 的 成 功 。 

相对 于 传统 的 32 位 虚拟 机 ，64 位 虚拟 机 所 具备 的 最 大 优势 就 是 可 
以 访问 大 内 存 。32 位 虚拟 机 最 大 可 用 内 存 空间 被 限定 在 了 4GB， 并 且 
Java 堆 区 的 大 小 配置 存在 最 大 限制 ， 如 果 是 在 Windows 平 台 下 最 大 只 
能 设置 到 1.5GB， 而 在 Linux 平 台 下 最 大 也 只 能 设置 到 2GB~3GB。 也 
就 是 说 ，Java 堆 区 的 内 存 大 小 设置 还 需要 依赖 于 具体 的 操作 系统 平 
ay 

既然 32 位 虚拟 机 无 法 满足 大 内 存 消 耗 的 应 用 场景 ， 那 么 64 位 虚拟 
机 的 出 现 则 是 顺理成章 的 。64 位 虚拟 机 之 所 以 能 够 访问 大 内 存 ， 是 因 
为 其 采用 了 64 位 的 指针 架构 ， 这 也 是 寻 址 访问 大 内 存 的 关键 要 素 。 

在 JDK1.6 Update14 版 本 之 前 ，64 位 虚拟 机 的 综合 性 能 表现 实际 上 
是 不 如 32 位 虚拟 机 的 ， 这 主要 是 因为 OOPS (Ordinary Object 
Pointers， 普 通 对 象 指针 ) 从 32 位 膨胀 到 64 位 后 ，CPU Cache Line 中 的 
可 用 OOPS 变 少 ， 这 样 一 来 就 会 直接 影响 并 降低 CPU 的 缓存 使 用 率 ， 这 


就 是 64 位 虚拟 机 在 性 能 上 之 所 以 落后 于 32 位 虚拟 机 的 主要 原因 。 其 
次 ， 由 于 部 署 在 64 位 虚拟 机 上 的 性 能 都 需要 用 到 大 内 存 ， 尤 其 是 互联 
网 项 目 ， 经 常 需要 使 用 多 达 几 十 乃至 几 百 GB 的 内 存 ， 这 对 于 传统 的 32 
位 虚拟 机 将 无 法 承载 ， 只 能 依靠 64 位 虚拟 机 去 支撑 。 但 是 管理 这 么 大 
的 内 存 开销 对 于 GC (Garbage Collection) 来 说 将 会 是 一 场 非 常 严 峻 的 
考验 ， 甚 至 很 有 可 能 会 导致 GC 在 执行 内 存 回收 期 间 消 耗 更 长 的 时 间 ， 
同时 也 意味 着 工作 线程 的 等 待 时 间 将 会 延长 。 如 今 随 着 64 位 虚拟 机 的 
逐渐 成 熟 ， 指 针 压 缩 将 会 通过 对 齐 补 白 等 操作 将 64 位 指针 压缩 为 32 
位 ， 以 此 改善 CPU 缓存 使 用 率 达 到 提升 64 位 虚拟 机 运行 性 能 的 目的 。 

对 于 小 型 项 目 来 说 ， 简 洁 性 则 更 受 青睐 ， 某 些 语言 非常 适 于 短 脚 
本 编写 或 者 在 命令 提示 符 下 的 交互 式 探索 编程 。Java 作 为 通用 性 语 
言 ， 则 更 适用 于 编写 跨 平 台 的 工具 。 在 这 种 情况 下 ,， “兄长 Java” 的 使 
用 并 不 一 定 能 够 带 来 额外 的 价值 。 虽 然 在 变量 命名 等 方面 ， 代 码 风 格 
可 以 改变 ， 不 过 从 历史 情况 来 看 ， 在 一 些 基本 的 层面 上 ,与 其 他 语言 
相 比 ， 完 成 同样 的 任务 ，Java 语 言 仍 需 更 多 的 字符 。 为 了 应 对 这 些 限 
制 ，Java 语 言 一 直 在 不 断 地 更 新 ， 尝 试 包含 一 些 通常 称 为 “语法 糖 ” 的 
功能 。 用 这 些 习 语 可 以 实现 用 更 少 的 字符 表示 相同 功能 的 目标 ,与 其 
对 应 的 更 加 元 长 的 配对 物 相 比 ， 这 些 习 语 更 受 程序 开发 社区 的 欢迎 ， 
也 会 被 社区 作为 通用 用 法 快速 地 采用 。 

现代 CPU 架构 将 多 核 、 多 硬件 执行 线程 技术 推 向 前 台 ， 这 意味 着 
我 们 可 以 利用 更 多 的 CPU 资源 做 更 多 的 工作 。 然 而 ， 要 利用 好 这 些 额 
外 的 CPU 资源 ， 运 行 于 其 上 的 程序 必须 要 能 够 支持 并 行 工作 这 个 需 
求 。 通 俗 点 讲 ， 这 些 程序 需要 按照 多 线程 的 方式 构造 或 设计 才能 充分 
地 利用 额外 的 硬件 线程 。 

最 近 这 几 年 ， 服 务 器 端 网 络 使 用 的 基础 通信 技术 并 没有 取得 太 大 
的 进步 。 服 务 器 端 大 多 数 在 绝 不 允许 服务 中 断 的 关键 任务 环境 中 ， 新 
技术 很 难 渗透 ， 也 很 难 植 根 于 这 样 的 环境 。 但 正 因 如 此 ， 服 务 器 端的 
多 余部 分 才 得 以 被 剔除 ， 逐 渐 地 形成 了 非常 精简 单纯 的 风格 。 网 络 的 
基础 技术 可 以 说 已 经 成 型 了 ， 然 而 在 网 络 上 运行 的 网 络 设备 和 服务 器 
的 技术 仍然 踩 着 现在 进行 时 的 节奏 在 持续 不 断 地 爆发 性 发 展 ， 由 此 出 
现 了 虚拟 技术 和 网 络 存 储 技 术 等 基于 网 络 的 创新 技术 。 如 今 ， 它 们 已 
经 在 系统 中 不 可 或 缺 。 随 着 这 些 技 术 的 发 展 ， 人 们 追求 的 网 络 形 态 和 


网 络 设计 的 方式 也 在 时 刻 发 生 着 变化 ， 基 础 架构 工程 师 和 服务 器 工程 
师 必 须 能 灵活 应 对 这 些 变化 才 行 。 对 应 地 ， 软 件 设计 程序 员 也 需要 有 
针对 性 地 做 出 应 对 措施 。 

虚拟 化 技术 是 一 种 资源 管理 技术 ， 是 将 计算 机 的 各 种 实体 资源 ， 
如 服务 器 、 网 络 、 内 存 及 存储 等 ， 予 以 抽象 、 转 换 后 呈现 出 来 。 此 举 
打破 了 实体 结构 间 的 不 可 切割 的 障碍 ， 使 用 户 可 以 用 比 原 本 形态 更 好 
的 方式 来 应 用 这 些 资源 。 虚 拟 化 资源 一 般 包 括 计算 能 力 和 资料 存储 介 
质 ， 这 些 资源 的 虚拟 部 分 不 受 现 有 资源 的 架设 方式 、 地 域 或 物理 形态 
所 限制 。 虚 拟 化 技术 在 市 来 成 本 节省 和 运 维 便利 的 同时 ， 也 市 来 了 一 
些 新 的 挑战 ， 对 架构 师 、 运 维 人 员 、 程 序 员 等 角色 提出 了 新 的 要 求 。 
在 解决 了 物理 设施 的 虚拟 化 问题 之 后 ， 我 们 的 目光 可 能 就 会 转移 到 应 
用 程序 本 身上 来 ， 因 为 这 才 是 真正 为 用 户 体现 支付 价值 的 关键 所 在 。 
特别 需要 注意 的 是 ， 部 署 在 虚拟 化 环境 上 的 Java 应 用 与 物理 环境 上 的 
应 用 存在 明显 的 区 别 。 

综 上 所 述 ， 性 能 优化 本 身 对 于 程序 性 能 是 至 关 重 要 的 ， 同 时 性 能 
优化 也 是 一 门 综合 性 课程 ， 虽 然 本 书 针对 的 是 Java 程 序 的 性 能 优化 ， 
但 是 依然 需要 考虑 综合 性 因素 。 作 者 认为 ， 随 着 IT 技 术 的 蓬勃、 快速 
发 展 ， 性 能 调 优 已 经 不 单纯 是 代码 级 别 的 调 优 ， 它 是 一 个 对 综合 性 知 
识 的 深入 理解 需求 ， 我 们 只 有 结合 多 方面 的 技术 才能 真正 找到 合理 的 
解决 方案 。 这 也 是 本 书 除了 深入 介绍 Java 程 序 调 优 、JVM 调 优等 之 
外 ， 坚 持 引 入 服务 器 、 网 络 、 云 计算 、 虚 拟 化 等 多 维 技术 点 的 原因 。 


1.2 性 能 优化 的 参考 因素 


系统 性 能 优化 ， 或 者 称 之 为 程序 性 能 优化 ， 它 存在 的 理由 有 很 
多 。 举 一 个 政治 上 的 例子 ， 意 大 利 由 于 天 生 的 漫长 海岸 线 ， 所 以 它 一 
直 以 来 都 是 难民 逃亡 欧洲 的 跳板 。 意 大 利 政府 一 直 都 受 困 于 这 个 难民 
潮 问 题 ， 不 管 阻拦 还 是 放行 难民 ， 这 些 举措 都 会 受到 北欧 国家 的 指 
责 。 后 来 意大利 政府 从 很 多 难民 口中 知道 他 们 其 实 想 去 德国 ， 只 不 过 
路 过 这 里 ， 所 以 干脆 就 来 一 招 狠 的 ， 让 难民 填写 意愿 国家 ， 只 要 填写 
了 就 直接 大 巴 送 到 国境 线 上 去 。 这 样 一 来 ， 德 国 吃紧 了 ， 一 下 子 很 多 
难民 涌 入 ， 就 造成 了 整个 国家 的 运转 问题 。 就 好 似 计算 机 程序 的 性 能 


问题 ， 面 对 海量 数据 或 者 任务 时 ， 无 论 如 何 你 都 会 辜 到 性 能 压力 ， 唯 
一 的 选择 是 你 会 把 这 个 压力 放 在 哪 一 层 或 者 哪 一 个 位 置 来 应 对 ， 以 及 


采取 什么 应 对 措施 。 下 面 开 始 具体 解释 这 些 造成 性 能 问题 的 因素 点 。 
1.2.1 传统 计算 机 体系 的 分 歧 


如 果 说 图 灵 [15] 奠 定 的 是 计算 机 的 理论 基础 ， 那 么 冯 : 诺 依 曼 [16] 
则 是 将 图 灵 的 理论 物化 为 实际 的 物理 实体 ， 成 为 了 计算 机 体系 结构 的 
奠基 者 。 从 第 一 台 冯 : 诺 依 曼 计算 机 诞生 到 今天 已 经 过 去 了 将 近 70 年 ， 
计算 机 的 技术 与 性 能 也 都 发 生 了 巨大 的 变化 ， 但 整个 主流 体系 结构 依 
然 是 冯 : 诺 依 曼 结构 。 

冯 : 诺 依 曼 体 系 结构 是 采用 二 进 制 形 式 存 储 数据 ， 硬 件 由 5 个 部 分 
组 成 ， 分 别 是 运算 器 、 控 制 器 、 存 储 器 、 输 入 设备 和 输出 设备 。 同 时 
提出 了 “存储 程序 ”原理 ， 即 使 用 同一 个 存储 器 ， 然 后 经 由 同一 个 总 线 
传输 ， 程 序 和 数据 统一 存储 ， 同 时 在 程序 控制 下 上 自动 工作 。 特 别 要 指 
出 ， 它 的 程序 指令 存储 器 和 数据 存储 器 是 合并 在 一 起 的 ， 程 序 指令 存 
储 地 址 和 数据 存储 地 址 指向 同一 个 存储 器 的 不 同 物理 位 置 。 因 为 程序 
令 和 数据 都 用 二 进 制 码 表示 ， 且 程序 指令 和 被 操作 数据 的 地 址 又 密 
切 相关 ， 所 以 几 十 年 前 选择 这 样 的 结构 是 合理 的 。 

但 是 ， 随 着 对 计算 机 处 理 速度 要 求 的 提高 和 对 需要 处 理 数据 的 种 
类 、 量 级 的 需求 不 断 增 大 ， 这 种 指令 和 数据 共用 一 个 总 线 的 结构 ， 使 
得 信息 流 的 传输 成 为 限制 计算 机 性 能 的 一 个 瓶颈 ， 制 约 了 数据 处 理 速 
度 的 提高 。 由 此 ， 体 现 出 了 冯 : 诺 依 曼 体 系 结构 的 局 限 性 ， 如 下 面 4 
占 E 

(1) 目前 CPU 的 处 理 速度 和 内 存 容 量 的 增长 速率 要 远大 于 两 者 之 
间 的 流量 ， 将 大 量 数值 从 内 存 搬入 搬出 的 操作 占用 了 CPU 大 部 分 的 执 
行 时 间 ， 也 造成 了 总 续 的 瓶颈 ; 

(2) 程序 指令 的 执行 顺序 是 串 行 的 ， 由 程序 计数 器 控制 ， 这 样 使 
得 即使 有 关 数 据 已 经 准备 好 了 ， 也 必须 遵循 逐条 执行 指令 序列 ， 这 样 
的 设计 影响 了 系统 运行 的 速度 ; 

(3) 存储 器 是 线性 编 址 ， 按 顺序 排列 的 地 址 访问 ， 这 样 设计 有 利 
于 存储 和 执行 机 器 语言 ， 适 用 于 数值 计算 。 高 级 语言 的 存储 及 用 的 是 


一 组 有 名 字 的 变量 ， 是 按 名 字 调 用 变量 而 不 是 按 地 址 访问 ， 且 高 级 语 
言 中 的 每 个 操作 对 于 任何 数据 类 型 都 是 通用 的 ， 不 管 采用 何 种 数据 结 
构 ， 多 维 数组 [17]、 二 叉 树 [18] 还 是 图 ， 最 终 在 存储 器 上 都 必须 转换 成 
一 维 的 线性 存储 模型 进行 存储 。 这 些 因 素 都 导致 了 机 器 语言 和 高 级 语 
言 之 间 存 在 很 大 的 语义 差距 ， 这 些 语 义 差 距 之 间 的 映射 大 部 分 都 要 由 
编译 程序 来 完成 ， 在 很 大 程度 上 增加 了 编译 程序 的 工作 量 ，; 

(4) 冯 : 诺 依 曼 体系 结构 计算 机 是 为 逻辑 和 数值 运算 而 诞生 的 ， 
它 以 CPU 为 中 心 ，IO 设 备 与 存储 器 间 的 数据 传送 都 要 经 过 运算 器 ， 在 
数值 处 理 方面 已 经 达到 很 高 的 速度 和 精度 ， 但 对 非 数 值 数据 的 处 理 效 
率 比 较 低 ， 需 要 在 体系 结构 方面 有 革命 性 突破 。 

科学 家 们 一 直 在 努力 突破 传统 的 冯 : 诺 依 曼 体系 结构 框架 ， 对 冯 - 诺 
依 曼 计 算 机 进行 改良 ， 主 要 体现 在 以 下 3 点 : 

(1) 将 传统 计算 机 只 有 一 个 处 理 器 串 行 执行 改 成 多 个 处 理 器 并 行 
执行 ， 依 靠 时 间 上 的 重臣 来 提高 处 理 效率 ， 形 成 支持 多 指令 流 、 多 数 
据 沅 的 并 行 算法 结构 

(2) 改变 传统 计算 机 控制 流 驱 动 的 工作 方式 ， 设 计数 据 流 驱动 的 
工作 方式 ， 只 要 数据 准备 好 了 ， 就 可 以 并 行 执行 相关 指令 ，; 

(3) 跳出 采用 电信 号 二 进 制 范 畴 ， 选 取 其 他 物质 作为 执行 部 件 和 
言 息 载体 ， 如 光子 、 量 子 或 生物 分 子 等 。 

近 几 年 ， 在 计算 机 体系 结构 研究 方面 也 已 经 有 了 重大 进展 ， 越 来 
越 多 的 非 冯 式 计算 机 相继 出 现 ， 如 光子 计算 机 、 量 子 计算 机 、 神 经 计 
算 机 以 及 DNA 计 算 机 等 。 

光子 计算 机 (Photonic Computer) 是 一 种 采用 光 信 号 作为 物质 介 
质 和 信息 载体 ， 依 靠 激 光束 进入 反射 镜 和 透镜 组 成 的 阵列 进行 数值 运 
算 、 逻 辑 操作 和 信息 的 存储 和 处 理 。 它 可 以 实现 对 复杂 度 高 、 计 算 量 
大 、 实 时 性 强 的 任务 的 高 效 、 并 行 处 理 ， 比 普通 电子 计算 机 快 1000 
音 ， 在 图 像 处 理 、 模 式 识别 和 人 工 智 能 方面 有 着 非 党 巨大 的 应 用 前 

神 织 神 能 成 神经 计算 经 元 为 处 理 、 自 学 习 、 经 计算 机 可 决策 。 它 
的 ， 适 用 于 图 机 (Neural 信 息 的 基本 自 适 应 及 自 以 模 拟人 的 左 脑 由 100 
形 图 像 识 别 Computer) 是 单元 ， 将 模仿 修复 功能 ， 可 左 脑 和 右 脑 ， 万 


个 神经 元 组 。 这 将 有 可 能 一 种 可 以 并 大 脑 神 经 记 以 模仿 入 脑 能 识别 语 
言 成 ， 用 于 存 成 为 人 工 智 行 处 理 多 种 忆 的 信息 存 的 判断 能 力 文 字 和 图 
形 储 文字 和 语 能 硬件 发 展 的 数据 功能 的 神 放 在 神经 元 上 和 适应 能 力 。 
图 像 ， 能 控制 法 规则 ， 右 脑 主 攻 方 向 。 经 网 络 计 算 。 神 经 网 络 美国 科 
学 家 机 器 人 行为 由 1 万 多 个 机 ， 它 以 具有 自 组 研究 出 的 ， 进 行 智 神经 元 
组 

久子 比 它 的 量子 计算 处 理 量子 信 、 束 缚 离子 特 位 不 同 ， 可 以 同时 
表 硬 件 条 件 。 机 (Quantum 息 的 物理 装 和 原子 等 制 对 量子 位 操作 示 多 
种 状态 Computer) 置 。 量 子 计算 成 的 量子 位 ，1 次 等 同 于 。 这 些 都 为 新 
是 一 种 遵循 机 本 身 的 特 创 造 出 了 经 对 经 典 位 操 的 算法 实现 量子 力学 规 
性 ， 扩 充 了 典 条 件 下 不 作 2 次 ， 因 为 提供 了 条 件 律 进行 高 速 数 逻 辑 和 数 
学 理 可 能 存在 的 新 量子 不 像 半 ， 也 为 人 工 智 学 和 逻辑 运 论 ， 通 过 核 的 
逻辑 门 。 导 体 只 能 记录 能 的 发 展 提 算 、 和 存储 自 旋 、 光 与 经 典 的 0 和 1， 
供 了 可 能 

可 计 这 这 新 我 们 不 可 能 在 今后 很 算 机 更 快速 样 复杂 的 结 样 才能 使 
计 的 信息 时 代 否 认 ， 冯 :长 的 一 段 时 、 更 高 效 、 构 ， 我 们 需要 算 机 有 质 
的 。 诺 依 曼 计 算 机 期 里 还 将 为 人 更 方便 的 使 用 突破 现 有 的 飞跃 。 相 信 
未 以 其 技术 成 类 的 工作 和 要 求 ， 为 了 体系 结构 框 来 随 着 非 双 熟 、 价 格 
低 生 活 发 挥 着 让 计算 机 能 架 并 寻求 新 的 式 计算 机 的 廉 、 软 件 丰 富 重要 
作用 。 但 够 模拟 人 脑 神 物质 介质 作 商 业 化 推进 ， 和 大 众 的 使 是 ， 为 了 
满 经 元 和 脑 电 为 计算 机 的 信 我 们 将 会 迎 用 习惯 ， 足 人 们 对 信号 脉冲 息 
载体 ， 来 一 个 新 


1.2.2 导致 系统 瓶颈 的 计算 资源 
成 根据 应 用 为 系统 瓶颈 程序 的 不 同 的 计算 资源 特点 ， 任 何 计 如 图 


1-1 所 示 算 机 部 件 都 ， 包 括 CPU 有 可 能 成 为 、 内 存 、 磁 盘 系统 瓶颈 爆 
发 、 网 络 、 数 点 。 其 中 ， 据 库 等 。 最 有 可 能 


图 1-1 系统 瓶颈 原因 

m CPU 对 CP 资源 需 ; 对 计算 资源 U 的 争夺 将 求 较 大 。 要 求 较 高 的 
导致 性 能 问题 应 用 ， 由 于 其 。 如 视频 分 长 时 间 、 不 析 、 科 学 计 间 上 断 地 
大 量 算 、3D 泻 染 占用 CPU 资 等 应 用 场景 源 ， 这 样 都 对 CPU 

m AF: 非 应 用 一 般 来 说 ， 程 序 进行 了 只 要 应 用 程序 高 频率 的 内 
设计 合理 ， 存 交换 和 扫描 内 存在 读 写 ， 但 这 些 情 速 度 上 不 太 可 况 比 较 
少见 。 能 成 为 性 能 内 存 制 约 系 瓶 颈 ， 除 统 性 能 的 最 可 能 发 生 的 情况 是 
内 存 大 小 不 足 ， 这 种 情况 下 会 导致 应 用 程序 无 法 创建 对 象 ， 更 严重 其 
至 导致 操作 系统 无 法 正常 运行 。 与 磁盘 相 比 ， 内 存 的 大 小 较 小 ， 这 意 
味 着 应 用 软件 只 能 尽 可 能 将 常用 的 核心 数据 读 入 内 存 ， 大 量 的 数据 还 
是 需要 存放 在 磁盘 上 ， 这 个 特性 在 一 定 程度 上 降低 了 系统 性 能 。 

日 磁盘 IO : 磁盘 IO 读 写 速度 比 内 存 慢 很 多 。 随 着 硬盘 技术 的 不 
断 发 展 ，SSD[19] 固 态 硬盘 的 引入 确实 已 经 加 快 了 磁盘 的 读 写 速 度 ， 但 
是 性 价 比 不 高 ， 速 度 也 还 是 慢 于 内 存 。 因 为 读 写 性 能 原因 ， 程 序 在 运 
行 过 程 中 ， 如 果 需 要 等 待 磁盘 1/O 完 成 ， 那 么 低 效 的 1/O 操 作 会 拖累 整 
个 系统 。 

网 络 传送 : 对 网 络 数据 进行 读 写 的 情况 与 磁盘 IO 类 似 。 由 于 网 
络 环境 的 不 确定 性 ， 尤 其 是 对 互联 网 上 数据 的 读 写 ， 网 络 操作 的 速度 
可 能 比 本 地 磁盘 IO 更 慢 。 因 此 ， 如 果 不 加 特殊 处 理 ， 也 极 有 可 能 成 为 


m 数据 库 : 大 部 分 应 用 程序 都 离 不 开 数据 库 ， 无 论 是 关系 型 数据 
库 ， 还 是 列 式 数 据 库 ， 它 们 都 存在 连接 数量 、 读 写 速度 、 数 据 合并 等 
制约 因素 ， 而 针对 海量 数据 的 读 、 写 操作 则 可 能 更 加 耗费 时 间 。 应 用 
程序 可 能 需要 等 待 数据 库 操作 完成 或 者 等 待 返回 检索 请 求 需要 的 结果 
集 ， 即 这 类 同步 操作 容易 成 为 系统 瓶颈 。 我 们 可 以 通过 一 些 异 步 操 
作 、 多 数据 中 心 等 方式 来 解决 局 部 问题 ， 但 是 无 法 解决 所 有 由 于 数据 
库 导 致 的 问题 。 总 的 来 说 ， 数 据 库 是 最 容易 导致 应 用 程序 性 能 瓶颈 的 
原因 之 一 。 

m ARF: 对 高 并 发 程序 来 说 ， 如 果 存 在 激烈 的 锁 竞 争 ， 无 疑 是 
对 性 能 极 大 的 打击 。 锁 竞争 将 会 明显 增加 线程 上 下 文 切 换 的 开销 ， 而 
且 这 些 开 销 都 是 与 应 用 需求 无 天 的 系统 开销 ， 导 致 大 量 占用 宝贵 的 
CPU 资源 ， 却 不 带 来 任何 好 处 。 总 的 来 说 ， 锁 竞争 问题 对 于 程序 员 来 
说 最 难处 理 ， 因 为 处 理 这 方面 问题 需要 大 量 的 操作 系统 、 编 程 语言 并 
发 知识 及 经 验 。 

m RI 对 Java 应 用 来 说 ， 异 常 的 捕获 和 处 理 是 非常 消耗 资源 
的 。 如 果 程序 高 频率 地 进行 异常 处 理 ， 则 整体 性 能 便 会 有 明显 下 降 。 
高 级 编程 语言 一 般 都 提供 异常 捕获 及 处 理 机 制 ， 相 对 来 说 程序 员 比 较 
容易 掌握 。 


1.2.3 程序 性 能 衡量 指标 


如 果 抛 开 所 有 的 内 部 技术 因素 ， 我 们 只 看 应 用 程序 的 性 能 指标 ， 
那么 一 般 来 说 ， 程 序 的 性 能 大 体 可 以 通过 以 下 几 个 方面 来 衡量 。 

m 响应 时 间 : 系统 对 用 户 行为 或 者 事件 做 出 响应 的 时 间 。 响 应 时 
间 越 得， 性 能 一 定 越 好 ， 所 以 我 们 在 系统 设计 过 程 中 应 该 尽量 采用 异 
步 处 理 方 式 ， 让 用 户 能 够 尽快 收 到 回执 ， 这 样 用 户 体 验 会 较 好 。 

m 启动 时 间 : 应 用 系统 从 运行 到 可 以 正常 处 理 业 务 所 需要 花费 的 
时 间 ， 对 于 用 户 来 说 ， 肯 定 是 越 快 启动 越 好 ， 所 以 我 们 在 系统 设计 过 
程 中 应 该 尽量 采用 异步 加 载 数据 的 方式 启动 应 用 程序 ， 避 免 等 待 所 有 
数据 加 载 完 毕 后 才 启 动 。 

m 执行 时 间 : 一 段 代 码 从 开始 运行 到 运行 结束 ， 所 使 用 的 时 间 称 
为 执行 时 间 。 对 于 执行 时 间 ， 有 些 时 候 可 能 无 法 减少 全 局 化 的 时 间 ， 


但 是 可 以 通过 把 业务 逻辑 切 分 到 多 段 连 续 的 程序 段 中 ， 让 用 户 感 觉 执 
行 时 间 减 短 了 。 

m 执行 速度 : 程序 的 反应 是 否 迅 速 ， 响 应 时 间 是 否 足够 短 。 该 指 
标 与 响应 时 间 、 执 行 时 间 是 相关 联 的 。 

n 计算 资源 分 配 : 计算 资源 ， 包 括 CPU、 内存、 磁盘 等 ， 如 果 其 
中 的 任何 一 项 分 配 不 合理 ， 可 能 会 导致 整个 系统 始终 处 于 计算 资源 紧 
张 的 情况 下 ， 这 样 对 于 整个 系统 的 性 能 影响 一 定 是 毁灭 性 的 。 

m 内 存 分 配 : 内 存 分 配 是 否 合理 ， 是 否 过 多 地 消耗 内 存 或 者 存在 
泄漏 ，JVM 性 能 也 与 内 存 分 配 有 一 定 关系 。 

m 磁盘 吞吐 量 : 描述 1/O 的 使 用 情况 。IOPS (Input/Output Per 
Second) 即 每 秒 的 输入 输出 量 (或 读 写 次 数 ) ， 是 衡量 磁盘 性 能 的 主 
要 指标 之 一 。IOPS 是 指 单位 时 间 内 系统 能 处 理 的 IO 请 求 数 量 ，LIO 请 
求 通 常 为 读 或 写 数 据 操作 请 求 。 随 机 读 写 频繁 的 应 用 ， 如 OLTP 
(Online Transaction Processing) ，IOPS 是 关键 衡量 指标 。 另 一 个 重要 
中 标 是 数据 吞吐 量 (Throughput) ， 指 单位 时 间 内 可 以 成 功 传输 的 数 
据 数 量 。 对 于 大 量 顺 序 读 写 的 应 用 ， 如 VOD (Video On Demand) ， 
则 更 关注 吞吐 量 指标 。 每 秒 MO 吞 吐 量 =IJOPSx 平 均 IO SIZE。 从 公式 可 
UAH, IO SIZE 越 大 ，IOPS 越 高 ， 那 么 每 秒 MO 的 吞吐 量 就 越 高 。 
此 ， 我 们 会 认为 IJOPS 和 吞吐 量 的 数值 越 高 越 好 。 实 际 上 ， 对 于 一 个 磁 
盘 来 讲 ， 这 两 个 参数 均 有 其 最 大 值 ， 而 且 这 两 个 参数 也 存在 着 一 定 的 
关系 。 

m 网 络 吞 吐 量 : 描述 网 络 的 使 用 情况 。 网 络 中 的 数据 由 一 个 个 数 
据 包 组 成 ， 防 火 墙 对 每 个 数据 包 的 处 理 要 耗费 资源 。 吞 吐 量 是 指 在 没 
有 帧 丢失 的 情况 下 ， 设 备 能 够 接受 的 最 大 速率 。 其 测试 方法 是 : 在 测 
试 中 以 一 定 速率 发 送 一 定数 量 的 帧 ， 并 计算 待 测 设备 传输 的 帧 ， 如 果 
发 送 的 帧 与 接收 的 帧 数量 相等 ， 那 么 就 将 发 送 速率 提高 并 重新 测试 ; 
如 果 接 收 的 帧 少 于 发 送 的 帧 则 降低 发 送 速率 重新 测试 ， 直 至 得 出 最 终 
结果 。 吞 吐 量 测试 结果 以 “比特 / 秒 ” 或 “ 字 节 / 秒 ” 表 示 。 

m 负载 承受 能 力 : 当 系 统 压力 上 升 时 ， 系 统 的 执行 速度 、 响 应 时 
间 的 上 升 曲线 是 否 平缓 。 负 载 承 受 能 力 与 计算 资源 、 内 存 、 磁 盘 、 网 
络 等 多 方面 因素 都 有 关联 。 


1.2.4 性 能 优化 目标 


与 前 面 章 节 不 同 ， 我 们 这 里 抛 开 所 有 的 外 部 因素 ， 只 单纯 分 析 
Java 程 序 本 身 ， 那 么 大 多 数 Java 程 序 性 能 优化 目标 都 可 以 归纳 到 下 面 
TES 

m 编写 更 有 效率 的 代码 : 应 用 程序 的 每 CPU 指令 时 钟 周期 

(Clocks Per Instruction, CPI) 指 的 是 执行 一 条 CPU 指令 所 消耗 的 CPU 
时 钟 数 。 编 译 器 将 Java 源 代码 编译 成 字 节 码 ， 而 CPI 正 是 被 用 来 衡量 字 
节 码 效率 的 指标 。 由 于 应 用 程序 的 最 终 执行 基于 字 节 码 ， 所 以 调整 应 
用 程序 、Java 虚 拟 机 或 操作 系统 ， 缩 短 应 用 程序 的 CPI， 让 编译 器 生成 
更 优 的 指令 等 ， 这 些 举措 都 有 助 于 提升 应 用 程序 的 性 能 。 执 行路 径 长 
度 与 CPI 之 间 有 微妙 的 差别 ， 执 行路 径 长 度 与 应 用 程序 的 算法 选择 关 
系 密 切 ， 而 CPI 与 编译 器 生成 更 有 效 的 代码 有 关 。 前 者 着 眼 于 通过 选 
择 合理 的 算法 生成 最 短 的 CPU 指令 序列 ， 后 者 着 眼 于 让 编译 器 生成 最 
高 效 的 代码 ， 减 少 每 条 CPU 指令 上 消耗 的 CPU 时 钟 周 期 数 。 如 果 CPU 
时 钟 周期 被 用 来 执行 操作 系统 指令 或 内 核 代 码 ， 那 么 这 部 分 时 钟 周 期 
就 无 法 用 于 执行 应 用 程序 。 因 此 ， 改 善 应 用 程序 性 能 的 策略 之 一 是 减 
少 消耗 在 系统 或 内 核 CPU 上 的 时 钟 周期 数 。 注 意 ， 该 策略 不 适用 于 在 
操作 系统 或 内 核 态 上 消耗 时 间 极 少 的 应 用 程序 。 

m 使 用 更 高 效 的 算法 : 对 应 用 程序 进行 性 能 调 优 所 获得 的 最 大 收 
益 来 自 于 算法 效率 的 提高 。 高 效 的 算法 主要 可 以 在 业务 逻辑 处 理 层 面 
起 到 重要 的 作用 ， 可 以 让 应 用 程序 使 用 更 少 的 CPU 指令 、 更 短 的 执行 
路 径 来 实现 程序 功能 。 通 常情 况 下 ， 拥 有 更 短 执行 路 径 的 应 用 程序 运 
行 得 更 快 。 从 应 用 程序 来 看 ， 使 用 更 好 的 数据 结构 或 者 改进 算法 可 以 
构造 出 更 短 的 执行 路 径 ， 很 多 应 用 程序 的 性 能 问题 都 源 于 使 用 了 不 合 
适 的 数据 结构 。 因 此 ， 使 用 恰当 的 数据 结构 及 算法 是 提升 程序 性 能 最 
有 效 的 方法 。 在 性 能 分 析 过 程 中 ， 我 们 要 充分 注意 程序 使 用 的 数据 结 
构 及 算法 ， 尽 可 能 采用 更 优 的 方式 ， 这 样 做 才能 最 大 限度 地 提高 程序 
性 能 。 

m 减少 锁 竞争 : 对 共享 资源 的 竞争 容易 限制 应 用 程序 的 可 扩展 
性 。 频 繁 进行 锁 竟 争 的 应 用 程序 的 性 能 是 无 法 随 线程 数 和 CPU 数 增加 


而 提高 的 ， 因 此 ， 减 少 锁 竞 争 的 频率 、 缩 短 锁 持 有 的 时 间 都 能 够 有 效 
地 优化 应 用 程序 。 


1.2.5 性 能 优化 策略 


上 面 各 子 章节 对 性 能 调 优 可 能 出 现 的 位 置 、 性 能 衡量 指标 、 优 化 
目标 等 进行 了 一 些 总 结 ， 下 面 列 举 几 点 常见 的 性 能 优 策 略 。 

m 用 空间 换 时 间 。 该 策略 属于 系统 架构 层面 的 优化 。 我 们 知道 ， 
各 种 缓存 机 制 ， 从 CPU L1/L2/RAM 到 硬盘 ， 都 可 以 通过 空间 换 时 间 的 
策略 。 这 类 策略 基本 上 是 通过 采用 把 计算 的 过 程 一 步 一 步 地 保存 或 者 
缓存 等 方式 ， 避 免 重 复 计算 的 发 生 。 具 体 的 方式 可 以 采用 数据 缓冲 、 
CDN 等 。 类 似 的 策略 还 表现 为 诸如 宛 余 数据 ， 比 如 数据 镜像 、 负 载 均 
衡 等 。 

m 用 时 间 换 空间 。 该 策略 也 属于 系统 架构 层面 的 优化 。 有 时 候 使 
用 少量 的 空间 ， 可 能 性 能 会 更 好 。 比 如 网 络 传输 ， 如 果 有 一 些 压缩 数 
据 的 算法 ， 例 如 Huffman 编 码 压 缩 算法 [20]， 该 算法 本 身 运行 过 程 其实 
很 耗 时 ， 但 是 因为 整体 来 看 性 能 瓶颈 在 网 络 传输 部 分 ， 所 以 用 时 间 来 
换 空间 反而 能 省 时 间 。 

m 简化 代码 。 该 策略 属于 基础 技术 层面 的 优化 。 最 高 效 的 程序 就 
是 不 执行 任何 代码 的 程序 ， 所 以 ， 大 多 数 情 况 下 我 们 可 以 认为 代码 越 
少 性 能 就 越 高 。 关 于 代码 级 优化 的 技术 ， 大 学 的 教科 书 中 有 很 多 示例 
了 。 比 如 ， 减 少 循环 的 层 数 、 减 少 递归 、 在 循环 中 少 声明 变量 、 少 做 
分 配 和 释放 内 存 的 操作 、 尽 量 把 循环 体内 的 表达 式 抽 到 循环 外 、 条 件 
表达 式 中 的 多 个 条 件 判 断 的 次 序 、 尽 量 在 程序 启动 时 把 一 些 东西 准备 
好 、 注 意 函 数 调 用 的 开销 ( 栈 上 开销 ) 、 注 意 面向 对 象 语言 中 临时 对 
象 的 开销 、 小 心 使 用 异常 〈 不 要 用 异常 来 检查 一 些 可 接受 可 忽略 并 经 
常 发 生 的 错误 ) ， 等 。 这 类 知识 需要 我 们 非常 了 解 编程 语言 和 常用 的 
语言 自 带 资源 库 。 从 同步 问 能 并 不 等 待 ， 码 上 的 根本 上 来 讲 题 ， 如 果 
单 好 ， 当 大 量具 体 我 们 会 简化 。， 不 一 定 越 少 纯 采用 同步 线程 同时 访 
在 第 5 章 详 的 代码 越 好 锁 (Synchro 问 代码 块 时 ， 细 介绍 。 所 以 ， 我 们 
需要 nized) 的 方 它 会 生成 大 ， 我 们 还 是 了 解 Java 本 地 式 ， 代 码 确实 量 
的 锁 ， 导 致 要 有 一 定 技术 库 的 实现 原 很 少 ， 但 是 系统 内 部 代 基 础 之 后 
才 理 ， 例 如 实际 的 性 码 块 互相 能 做 到 代 


m 并 行 处 进程 、 的 操作 出 多 进 型 任务 采用 资 区 域 ， 理 。 该 策略 多 
线程 的 方 系统 调度 和 程 多 线程 的 测试 ， 不 一 源 隔离 技术 这 样 可 以 保 必 
= 种 综 式 编写 代码 切换 开销 所 优势 实际 定 核 数 多 就 对 CPU 核 上 
证 更 多 的 并 合 性 策略 。 试 ， 那 么 计算 密 导 致 的 ， 这 类 应 用 过 程 中 ， 定 
是 最 佳 选 的 计算 资源 行程 序 同步 进 想 ， 如 果 C 集 型 需求 的 型 优化 策略 
我 们 会 针对 择 ， 也 有 些 进 行 切 分 ， 行 ， 这 也 与 PU 只 有 一 个 应 用 程序 反 

只 能 依靠 多 核 不 同 CPU 进 情况 需要 单 核 把 应 用 程序 线 整个 系统 的 
Ei 你 要 是 会 更 慢 ， 这 CPU 才能 行 大 量 高 并 能 力 强 的 C 程 部 署 到 不 架 
构 、 内 存 共 还 采用 多 是 由 巨大 真正 体现 发 、 密 集 PU， 然 后 同 的 隔离 享 
策略 、 任 务 调 需 要 我 扩展 的 度 机 制 等 多 们 的 程序 拥 程序 无 法 进 方面 因 
素 相 有 扩展 性 ， 不 行 并 行 处 理 天 联 。 并 行 处 能 水 平 或 垂 。 理 和 直 

化 计 找 以 综 上 所 述 上 来 看 ， 如 或 程序 代码 到 那 20% 的 较为 容易 
地 ， 我 们 把 经 典 图 1-2 所 示 ， 消 耗 了 809% 缺 陷 设 计 或 优化 、 解 决 的 二 八 
原则 统计 学 认为 的 系统 性 能 。 者 劣质 代码 ，80% 的 性 能 问 [21] 移 植 到 性 
能 ，20% 的 系统 如 果 我 们 可 那么 我 们 就 题 。 优 设 以 可 


图 1-2 二 八 原 则 


1.3 性 能 调 优 分 类 方法 


这 性 能 调 优 三 oe 般 来 问题 ， 阔 漏 说 可 以 分 为 基 才 能 
正常 工作 础 技术 、 架 。 构 、 层 次 这 三 个 方面 ， 如 图 1-3 所 示 ， 解 决 了 


J 
性 能 调 优 分 类 方法 


图 1-3 性 能 调 优 分 类 方法 


1.3.1 业务 方面 


1.3.1.1 商业 事务 

商业 事务 是 真实 用 户 体 验 的 直观 反映 ， 它 们 在 抓 取 用 户 与 应 用 交 
互 时 用 户 体验 到 的 实时 性 能 数据 。 测 量 商业 事务 的 性 能 ， 需 要 抓 取 一 
件 商业 事务 整体 的 响应 时 间 及 其 各 个 组 件 的 响应 时 间 。 这 些 响 应 时 间 
再 与 满足 业务 需求 的 基准 进行 比较 ， 从 而 决定 应 用 是 否 正常 。 

商业 事务 通过 其 入 口 进行 辨别 ， 即 它 是 用 户 与 你 的 业务 进行 互动 
的 入 口 。 这 类 互动 包括 ， 一 个 网 页 请 求 、 一 个 网 页 服务 调用 、 消 息 队 
列 中 的 一 条 消息 等 。 当 然 ， 你 也 可 以 基于 一 个 URL 参 数 为 同样 的 网 页 
请 求 定义 多 个 入 口 ， 或 基于 一 个 服务 调用 的 内 容 定 义 多 个 入 口 点 。 关 
键 在 于 ， 商 业 交 易 必 须 与 你 的 业务 流程 相关 联 ， 比 如 说 中 国 移动 的 空 
中 缴费 业务 对 应 到 系统 中 是 多 个 原子 服务 ， 我 们 就 应 该 将 这 几 个 原子 
服务 通过 相应 的 关联 聚合 成 一 个 空中 缴费 业务 来 进行 监控 。 

每 个 商业 交易 的 性 能 会 与 其 基准 进行 比较 ， 判 定 其 是 否 正 常 。 璧 
如 ， 如 果 某 个 商业 事务 的 响应 时 间 大 于 你 设 定 的 阅 值 ， 我 们 便 判 定 其 
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总 而 言 之 ， 商 业 事务 最 能 反映 用 户 体验 ， 因 此 它们 也 是 最 重要 的 
抓 取 维度 。 

1.3.1.2 外 部 服务 

外 部 服务 的 形式 多 种 多 样 ， 包 括 从 属 的 网 页 服务 、 遗 留 系统 或 数 
据 库 等 。 外 部 服务 是 与 应 用 交互 的 系统 。 运 行 在 外 部 服务 系统 中 的 代 
码 常 常 无 法 控制 ， 但 是 我 们 可 以 控制 这 些 系统 的 配置 ， 因 此 了 解 他 们 
是 否 运行 正常 以 及 何 时 出 错 也 很 重要 。 此 外 ， 我 们 必须 有 能 力 区 分 问 
题 是 出 自 应 用 本 身 ， 还 是 出 自 这 些 外 部 服务 系统 。 

从 商业 事务 的 角度 来 说 ， 我 们 可 以 辨别 并 测量 这 些 处 于 自身 应 用 
的 外 部 服务 。 例 如 ， 我 们 需要 配置 监控 方法 从 而 辨别 那些 包 衰 了 外 部 
服务 调用 的 方法 。 但 是 对 于 常见 的 协议 ， 诸 如 HITP 和 JDBC， 外 部 服 
务 可 以 自动 检测 。 

商业 事务 让 你 对 应 用 的 性 能 有 了 全 局 的 掌控 ， 帮 助 你 对 性 能 问题 
进行 分 类 。 但 是 外 部 服务 总 能 以 意 想不到 的 方式 极 大 地 影响 应 用 的 运 
行 ， 所 以 你 必须 监控 它们 。 

1.3.1.3 应 用 布局 

因为 云 的 出 现 ， 现 在 的 应 用 变 得 更 加 灵活 ， 即 应 用 环境 可 以 根据 
用 户 需求 调节 大 小 。 因 此 ， 对 应 用 的 布局 进行 检测 从 而 决定 实例 的 数 
量 是 否 合适 是 非常 重要 的 。 如 果 你 的 应 用 实例 太 多 ， 你 的 云 主 机 成 本 
就 会 增加 。 但 如 果 你 没有 足够 的 实例 ， 商 业 事务 就 会 受到 影响 。 具 体 
来 说 ， 你 需要 确定 是 否 有 应 用 中 的 实例 负载 过 大 ， 如 果 有 ， 你 或 许 想 
在 那个 应 用 中 添加 实例 。 从 应 用 的 角度 查看 实例 状态 很 重要 ， 因 为 单 
个 实例 可 能 由 于 垃圾 回收 之 类 的 因素 负载 过 大 ， 但 如 果 应 用 中 大 多 数 
实例 都 负载 过 大 ， 则 该 应 用 可 能 已 经 无 法 支持 它 接受 的 访问 量 。 


1.3.2 基础 技术 方面 


无 论 你 现在 正在 专注 于 前 端 软 件 技术 ， 还 是 后 端 软 件 技术 ， 所 有 
的 语言 都 需要 使 用 到 编译 器 ， 那 么 一 般 来 说 编译 器 是 如 何 工作 的 呢 ? 

编译 器 在 开始 工作 之 前 ， 需 要 知道 当前 的 系统 环境 ， 比 如 标准 库 
在 哪里 、 软 件 的 安装 位 置 在 哪里 、 需 要 安装 哪些 组 件 等 。 这 是 因为 不 
同 计算 机 的 系统 环境 不 一 样 ， 通 过 指定 编译 参数 ， 编 译 器 就 可 以 灵活 


适应 环境 ， 编 译 出 各 种 环境 都 能 运行 的 机 器 码 。 这 个 确定 编译 参数 的 
步骤 ， 就 叫 作 “配置 ”(configure) 。 源 码 肯 定 会 用 到 标准 库 函 数 
(standard library) 和 头 文 件 (header) 。 它 们 可 以 存放 在 系统 的 任意 
目录 中 ， 编 译 器 实际 上 没 办 法 自动 检测 它们 的 位 置 ， 只 有 通过 配置 文 
件 才能 知道 。 接 下 来 ， 就 是 从 配置 文件 中 知道 标准 库 和 头 文 件 的 位 
置 。 一 般 来 说 ， 配 置 文件 会 给 出 一 个 清单 ， 列 出 几 个 具体 的 目录 。 等 
到 编译 时 ， 编 译 器 就 按 顺 序 到 这 几 个 目录 中 ， 和 寻找 目标 。 

对 于 大 型 项 目 来 说 ， 源 码 文件 之 间 往 往 存 在 依赖 关系， 编译 器 需 
要 确定 编译 的 先后 顺序 。 假 定 A 文 件 依赖 于 B 文 件 ， 编 译 器 应 该 保证 做 
到 下 面 两 点 。 

(1) 只 有 在 B 文 件 编译 完成 后 ， 才 开始 编译 A 文 件 。 
(2) 当 B 文 件 发 生变 化 时 ，A 文 件 会 被 重新 编译 。 

不 同 的 源码 文件 ， 可 能 引用 同一 个 头 文 件 (比如 stdio.h[22]) 。 
编译 的 时 候 ， 头 文件 也 必须 一 起 编译 。 为 了 节省 时 间 ， 编 译 器 会 在 编 
译 产 码 之 前 ， 先 编译 头 文 件 。 这 保证 了 头 文件 只 需 编 译 一 次 ， 不 必 每 
次 用 到 的 时 候 都 重新 编译 了 ，Java 也 是 类 似 的 ， 称 为 Class 文 件 。 预 编 
译 完成 后 ， 编 译 器 就 开始 蔡 换 掉 源 码 中 bash 的 头 文 件 和 宏 。 预 处 理 之 
后 ， 编 译 器 就 开始 生成 机 器 码 。 对 于 某 些 编译 器 来 说 ， 还 存在 一 个 中 
间 步 骤 ， 会 先 把 源码 转 为 汇编 码 (assembly) ， 然 后 再 把 汇编 码 转 为 
机 器 码 。 机 器 码 生 成 后 连接 是 在 内 存 中 进行 的 ， 即 编译 器 在 内 存 中 生 
成 了 可 执行 文件 。 下 一 步 ， 必 须 将 可 执行 文件 保存 到 用 户 事先 指定 的 
安装 目录 。 表 面 上 ， 这 一 步 很 简单 ， 就 是 将 可 执行 文件 (连带 相关 的 
数据 文件 ) 拷贝 过 去 就 行 了 。 但 是 实际 上 ， 这 一 步 还 必须 完成 创建 目 
录 、 保 存 文件 、 设 置 权限 等 步骤 。 这 整个 的 保存 过 程 就 称 为 “安装 ” 

(mstallation) 过 程 。 最 后 我 们 可 以 通过 生成 若干 个 二 进 制 文件 的 形 
式 ， 以 开放 服务 把 编译 后 的 程序 提供 给 用 户 。 

1.3.2.1 前 端 技术 

@ 前 端 负 载 均衡 

通过 DNS[23] 的 负载 均衡 器 (一般 在 路 由 器 上 根据 路 由 的 负载 重 
定向 ) 可 以 把 用 户 的 访问 均匀 地 分 散在 多 个 Web 服 务 器 上 ， 这 样 的 做 
法 可 以 减少 Web 服 务 器 的 请 求 负载 。 因 为 HTTP 的 请 求 都 是 短 连 接 ， 所 


以 可 以 通过 很 简单 的 负载 均衡 器 来 完成 这 一 功能 。 注 意 ， 最 好 是 有 
CDN 网 络 让 用 户 连 接 与 其 最 近 的 服务 器 (CDN[24] 通 常 伴随 着 分 布 式 
存储 [25]) 。 

@ 减 少 前 端 连接 数 

通过 减少 访问 页 面 ，CSS 静 态 切 分 JS、 图 片 的 方式 ， 把 单一 用 户 
的 连接 数 降 到 最 低 。 

@ 减 少 网 页 大 小 增加 带宽 

通过 减少 网 页 上 附带 的 图 片 可 以 大 大 降低 网 络 带 宽 压 力 。 

前端 页 面 静态 化 

通过 静态 化 一 些 不 常 变化 的 页 面 和 数据 ， 可 以 通过 技术 手段 让 用 
户 直 接 从 内 存 中 读 取 这 些 信息 ， 这 样 可 以 减少 磁盘 IO[26]。 

卓 优化 查询 

对 于 查询 相同 内 容 的 用 户 ， 可 以 通过 反 向 代理 方式 处 理 。 这 样 的 
技术 主要 用 查询 结果 缓存 来 实现 ， 第 一 次 查询 时 需要 到 数据 库 获 得 数 
据 后 把 数据 放 到 缓存 ， 之 后 的 查询 直接 访问 高 速 缓存 。 

@ 缓 存 的 问题 

缓存 可 以 被 用 来 缓存 动态 页 面 ， 也 可 以 被 用 来 缓存 查询 的 数据。 
很 多 NoSQL[27] 数 据 库 可 以 解决 下 述 问题 。 

(1) 缓存 的 更 新 ， 也 叫 缓存 和 数据 库 的 同步 。 可 以 通过 缓存 失效 
时 间 限 定 、 中 心 统 一 更 新 等 方式 实现 ; 

(2) 缓存 的 换 页 。 通 过 把 一 些 不 活跃 的 数据 换 出 内 存 可 以 解决 内 
存 不 足 的 问题 ， 常 用 的 换 页 算法 有 FIFO、LRU、LFU 等 算法 ; 

(3) 缓存 的 重建 和 持久 化 。 缓 存 一 旦 丢失 ， 我 们 就 需要 重建 缓 
存 ， 如 果 数 据 量 很 大 ， 缓 存 重建 的 过 程 会 很 慢 ， 这 会 影响 生产 环境 ， 
所 以 ， 缓 存 的 持久 化 也 是 需要 被 考虑 的 。 

1.3.2.2 服务 端 技术 

数据 元 余 

通过 减少 表 连 接 的 方式 可 以 降低 数据 元 余 ， 但 是 它 牺牲 了 数据 的 
一 致 性 ， 风 险 比 较 大 。 通 过 NoSQL 可 以 元 余数 据 。 


@ 数 据 镜像 

几乎 所 有 主流 的 数据 库 都 支持 镜像 ， 数 据 库 的 镜像 带 来 的 好 处 之 
一 是 可 以 做 负载 均衡 。 把 一 台数 据 库 的 负载 均 分 到 多 台 上 ， 同 时 又 保 
证 了 数据 一 致 性 。 最 重要 的 是 ， 这 样 还 可 以 有 高 可 用 性 ， 起 到 HA[28] 
的 作用 。 

数据 镜像 的 数据 一 致 性 可 能 是 个 复杂 的 问题 ， 我 们 可 以 通过 针对 
单条 数据 进行 数据 分 区 的 方式 实现 该 功能 。 除 了 传统 方式 外 ， 我 们 可 
以 通过 现在 正 火 热 的 Docker[29] 来 实现 数据 镜像 。 

四 数据 分 区 

数据 镜像 不 能 解决 的 一 个 问题 就 是 数据 表 里 的 记录 太 多 ， 导 致 关 
系 型 数据 库 操作 太 慢 ， 可 以 通过 对 数据 进行 分 区 来 解决 该 问题 。 数 据 
分 区 有 很 多 种 做 法 ， 一 般 来 说 有 下 面 这 几 种 : 

(1) 把 数据 把 某 种 逻辑 来 分 类 。 比 如 火车 票 的 订 票 系统 可 以 按 各 
铁路 局 来 分 ， 可 按 各 种 车 型 分 ， 可 以 按 始 发 站 分 ， 可 以 按 目的 地 
分 ..….. 反 正 就 是 把 一 张 表 拆 成 多 张 有 一 样 的 字段 但 是 不 同 种 类 的 表 。 
这 样 ， 这 些 表 就 可 以 存在 不 同 的 机 器 上 以 达到 分 担负 载 的 目的 。 

(2) 把 数据 按 字段 切 分 。 比 如 把 一 些 不 经 常 改 的 数据 放 在 一 个 表 
里 ， 经 常 改 的 数据 放 在 另外 多 个 表 里 。 把 一 张 表 变 成 1 对 1 的 关系 ， 这 
样 ， 你 可 以 减少 表 的 字段 个 数 ， 同 样 可 以 提升 一 定 的 性 能 。 另 外 ， 字 
段 多 会 造成 一 条 记录 的 存储 会 被 放 到 不 同 的 页 表 里 ， 这 对 于 读 写 性 能 
都 有 问题 。 但 这 样 一 来 会 有 很 多 复杂 的 控制 。 

(3) 平均 分 表 。 因 为 第 一 种 方法 是 并 不 一 定 平均 分 均 ， 可 能 某 个 
种 类 的 数据 还 是 很 多 。 所 以 ， 也 有 采用 平均 分 配 的 方式 ， 通 过 主键 ID 
的 范围 来 分 表 。 

(4) 同一 数据 分 区 。 这 个 在 上 面 数据 镜像 提 过 。 也 就 是 把 同一 商 
品 的 库存 值 分 到 不 同 的 服务 器 上 ， 比 如 有 10000 个 库存 ， 可 以 分 到 10 台 
服务 器 上 ， 一 台 上 有 1000 个 库存 。 

这 四 种 分 区 都 有 好 有 坏 。 最 常用 的 还 是 第 1 种 。 数 据 一 旦 分 区 ， 你 
就 需要 有 一 个 或 是 多 个 调度 来 让 你 的 前 端 程序 知道 去 哪里 找 数 据 。 

NoSQL 数 据 库 因 为 它 特 有 的 分 布 式 、 数 据 互 备 概念 ， 所 以 已 经 解 
决 数据 分 区 问题 。 


后 端 系统 负载 均衡 

数据 分 区 可 以 在 一 定 程度 上 减轻 负载 ， 但 是 还 是 无 法 减轻 热点 数 
据 [30] 的 负载 ， 需 要 使 用 数据 镜像 来 减轻 负载 。 使 用 数据 镜像 ， 则 必 
然 要 使 用 负载 均衡 ， 我 们 需要 一 个 任务 分 配 系统 ， 该 系统 可 以 监控 各 
个 服务 器 的 负载 情况 ， 这 样 的 设计 有 点 类 似 于 Master-Slaves， 现 在 较 
为 流行 的 大 数据 Hadoop[31]、Spark[32] 等 大 数据 框架 都 是 按照 这 类 方 
式 设 计 的 。 

任务 分 配 服 务 设计 上 天 生 有 一 些 难 点 : 

m 负载 情况 比较 复杂 。 负 载 均衡 算法 设计 没有 固定 规则 ， 我 们 只 
有 根据 生产 环境 下 整体 的 系统 负载 能 力 、 单 台 机 器 的 负载 能 力 、 外 部 
等 待 任务 等 多 方面 的 情况 来 设计 该 算法 ; 

m 任务 分 配 服务 需要 任务 队列 。 任 务 队 列 可 以 帮助 保持 任务 排队 
序列 、 收 集 任 务 执行 状态 、 持 久 化 任务 ; 

m 任务 分 配 服 务 需要 高 可 用 性 的 技术 。 此 外 ， 我 们 还 需要 注意 被 
持久 化 的 任务 队列 如 何 转移 到 别 的 服务 器 上 。 

ub 

异步 采用 的 是 延 时 处 理 方 式 。 在 技术 上 来 说 ， 就 是 把 各 个 处 理 程 
序 做 成 并 行 化 ， 这 样 也 就 可 以 水 平 扩展 了 。 使 用 异步 方式 需要 考虑 几 
do: 


(1) 被 调用 方 的 结果 返回 ， 会 涉及 进程 线程 间 通 信 的 问题 ; 
(2) 如 果 程 序 需 要 回 滚 ， 回 滚 会 有 点 复杂 ; 
(3) 异步 通常 都 会 伴随 多 线程 多 进程 ， 并 发 的 控制 也 相对 麻烦 一 


IEE 。 


(4) 很 多 异步 系统 都 用 消息 机 制 ， 消 息 的 丢失 和 乱 序 也 会 是 比较 
复杂 的 问题 。 
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己 最 大 负荷 的 外 部 调用 拖 垮 ， 它 属于 一 种 对 自身 系统 的 保护 机 制 。 使 
用 节 流 阀 技 术 一 般 来 说 是 针对 一 些 自己 无 法 控制 的 系统 ， 比 如 ， 和 


B2C 网 站 对 接 的 银行 系统 ， 视 频 分 析 领 域 针 对 视频 的 流 控 措 施 均 属于 
这 类 功能 。 

mj ES E 

批量 处 理 的 技术 是 把 一 堆 属 于 相同 类 别 的 信息 放 在 一 起 请 求 批量 
处 理 的 过 程 ， 它 适用 于 离线 处 理 模 式 ， 即 适用 于 实时 性 要 求 不 高 的 需 
求 。 网 络 上 的 MTU 〈 最 大 传输 单元 ) ， 以 太 网 是 1500 字 节 ， 光 纤 可 以 
达到 4000 多 个 字 节 ， 如 果 你 的 一 个 网 络 包 没有 放 满 这 个 MTU， 那 就 是 
在 浪费 网 络 带 宽 ， 因 为 网 卡 的 驱动 程序 只 有 一 块 一 块 地 读 效 率 才 会 
高 。 因 此 ， 网 络 发 包 时 ， 我 们 需要 收集 到 足够 多 的 信息 后 再 做 网 络 
IO， 这 也 是 一 种 批量 处 理 的 方式 。 

四 垃圾 回收 技术 

从 Java 发 布 最 早 版 本 开始 ， 一 直 都 保留 的 核心 特性 就 是 垃圾 回 
收 ， 垃 圾 回收 使 我 们 不 再 需要 手动 管理 内 存 。 当 使 用 完 一 个 对 象 后 ， 
我 们 只 需 删 除 它 的 引用 ， 然 后 垃圾 回收 就 会 自动 释放 它 。 垃 圾 回收 为 
程序 员 们 减少 了 分 配 、 释 放 内 存 空间 等 烦琐 步骤 。 

尽管 垃圾 回收 达成 了 无 须 手动 管理 内 存 的 目标 ， 也 防止 了 传统 的 
内 存 港 露 ， 但 是 作为 代价 ， 垃 圾 回收 过 程 上 有 时 相当 笨拙 。 注 意 ， 根 据 
不 同 的 JVM， 垃 圾 回收 策略 也 有 所 不 同 。 垃 圾 回收 最 大 的 政 人 就 是 传 
说 中 的 主要 (major) 或 (full) 垃圾 回收 。 除 了 Azul JVM[33]， 所 有 
的 JVM 都 存在 这 个 问题 。 

当 垃 圾 回收 运行 时 ， 它 会 运行 一 项 可 达 性 测试 (reachability 
test) ， 它 会 创建 一 个 由 对 象 组 成 的 根 集合 (root set) ， 该 集合 包含 每 
个 运行 线程 中 的 直接 可 见 对 象 。 接 着 ， 它 会 探寻 根 集合 中 的 对 象 涉及 
的 其 他 对 象 ， 然 后 探寻 这 些 对 象 涉及 的 对 象 ， 直 到 所 有 对 象 都 被 涉 
及 。 在 这 个 过 程 中 ， 它 会 记录 (mark) 下 现时 活动 对 象 的 内 存 地 址 ， 
然后 把 不 被 使 用 的 所 有 地 址 都 扫除 (sweep) 。 说 得 更 恰当 些 ， 它 会 把 
没有 根 集合 对 象 引 用 的 内 存 都 释放 。 最 终 ， 它 会 压缩 、 整 理 这 些 内 
存 ， 这 样 新 的 对 象 才 能 获得 内 存 分 配 。 

JVM 分 布 式 模型 用 于 决定 是 在 一 个 JVM 还 是 多 个 JVM 上 执行 Java 
程序 。 你 可 以 根据 其 有 效 性 、 响 应 能 力 和 可 维护 性 来 进行 选择 。 当 在 
多 台 服 务 器 上 运行 JVM 时 ， 你 也 可 以 选择 将 多 个 JVM 运 行 于 一 台 服 务 


器 或 者 每 台 服 务 器 运行 一 个 JVM。 例 如 ， 对 于 每 台 服 务 器 ， 你 可 以 运 
行 一 个 使 用 8GB 堆 内 存 的 JVM， 也 可 以 运行 4 个 使 用 2GB 的 JVM。 你 应 
该 根据 处 理 器 内 核 的 个 数 、 程 序 的 特性 等 多 种 因素 来 决定 这 个 数量 。 
当 优 先 考虑 响应 能 力 时 ， 使 用 2GB 的 堆 内 存 会 优 于 8GB 的 ， 原 因 是 这 
样 能 在 更 短 的 时 间 内 完成 Full GC。 当 然 ，8GB 的 堆 内 存 可 以 降低 Full 
GC 的 频率 。 如 果 你 的 程序 使 用 了 内 部 缓存 ， 还 可 以 通过 增加 缓存 命中 
率 来 提高 响应 能 力 。 综 上 所 述 ， 选 择 合 适 的 模型 需要 考虑 应 用 程序 的 
特性 ， 然 后 在 各 种 模型 中 选 定 一 个 能 够 扬长 避 短 的 。 

此 外 ， 选 择 JVM 其 实 就 是 决定 使 用 32 位 还 是 64 位 的 JVM。 在 相同 
的 条 件 下 ， 你 最 好 用 32 位 的 。 因 为 32 位 的 JVM 比 64 位 性 能 更 好 。 然 
而 ，32 位 JVM 最 大 支持 的 堆 内 存 是 4GB (无 论 在 32 位 操作 系统 还 是 64 
位 的 上 ， 实 际 可 分 配 的 大 小 都 只 有 2~3GB) 。 如 果 需 要 更 大 的 堆 内 
存 ， 还 是 用 64 位 的 JVM 比 较 合 适 ， 未 来 的 趋势 也 是 64 位 。 


1.3.3 组 件 方面 


随 着 IT 技术 、 产 品 的 不 断 发 展 ， 目 前 主流 的 前 沿 技术 包括 云 计 
算 、 虚 拟 化 、CPU 多 核 、 异 构架 构 、 高 速 网 络 架构 等 ， 如 图 1-4 所 示 。 


图 1-4 架构 方面 涉及 的 技术 


1.3.3.1 云 计 算 


云 计算 是 继 1980 年 代 大 型 计算 机 到 客户 端 -服务 器 的 大 转变 之 后 的 
又 一 种 巨变 。 几 年 前 ， 业 界 对 于 虚拟 化 和 云 计算 是 否 能 够 在 商业 上 真 
正 应 用 还 有 很 多 争论 ， 但 目前 ， 云 计算 和 虚拟 化 已 经 被 广泛 应 用 于 迁 
勃发 展 的 互联 网 领域 以 及 传统 的 企业 级 解决 方案 之 中 ， 软 件 开发 和 部 
署 正 在 经 历 着 剧烈 的 变革 。 

云 计 算 (Cloud Computing) 是 基于 互联 网 的 相关 服务 的 增加 、 使 
用 和 交付 模式 ， 通 常 涉 及 通过 互联 网 来 提供 动态 易 扩 展 且 经 常 是 虚拟 
化 的 资源 。 云 是 网 络 、 互 联网 的 一 种 比喻 说 法 。 云 计算 甚至 可 以 让 你 
体验 每 秒 10 万 亿 次 的 运算 能 力 ， 拥 有 这 么 强大 的 计算 能 力 可 以 模拟 核 
爆炸 、 预 测 气候 变化 和 市 场 发 展 趋势 。 用 户 通 过 电脑 、 笔 记 本 、 手 机 
等 方式 接 入 数据 中 心 ， 按 自己 的 需求 进行 运算 。 对 于 云 计 算 的 定义 ， 
现 阶段 广 为 接受 的 是 美国 国家 标准 与 技术 研究 院 (NIST) 定义 ， 即 云 
计算 是 一 种 按 使 用 量 付费 的 模式 ， 这 种 模式 提供 可 用 的 、 便 捷 的 、 按 
需 的 网 络 访问 ， 进 入 可 配置 的 计算 资源 共享 池 (资源 包括 网 络 、 服 务 
器 、 存 储 、 应 用 软件 、 服 务 ) ， 这 些 资源 能 够 被 快速 提供 ， 只 需 投 入 
很 少 的 管理 工作 ， 或 与 服务 供应 商 进行 很 少 的 交互 。 

总 的 来 说 ， 云 计算 的 流行 是 一 种 大 势 所 趋 ， 但 是 将 所 有 的 数据 都 
存放 在 共有 云 是 否 安 全 ? 人 们 这 种 不 安 的 心理 引发 了 私有 云 ， 或 者 公 
司 内 部 数据 中 心 的 流行 。 此 外 ， 它 还 滋生 了 另 一 种 新 的 潮流 : 共有 云 
和 私有 云 的 混合 体 。 

1.3.3.2 虚拟 化 

实际 上 ， 在 各 种 类 型 的 企业 级 产品 化 应 用 中 ，Java 应 用 是 进行 虚 
拟 化 的 最 佳 选择 ， 因 为 它 很 容易 取得 成 功 。 通 过 分 享 我 们 的 经 验 ， 和 希 
望 能 够 帮助 你 避免 在 虚拟 化 大 规模 Java 平 台 时 所 遇 到 的 一 些 困 难 。 

本 书包 含 了 针对 物理 化 和 虚拟 化 Java 平 台 的 实验 过 程 和 结果 ， 希 
望 能 够 帮助 读者 在 进行 虚拟 化 之 前 ， 纠 正 他 们 在 物理 化 Java 平 台中 所 
IS TIAA) 

很 多 Java 应 用 开发 人 员 很 了 解 开发 过 程 ， 他 们 知道 如 何 编写 Java 
代码 以 及 如 何 对 JVM 进 行 调 优 。 但 是 ， 这 些 信息 通常 只 保存 在 开发 人 
员 的 脑子 里 面 ， 并 没有 分 享 给 其 他 人 员 。 通 常 ， 运 行 Java 平 台所 需要 
的 技能 在 开发 人 员 和 管理 人 员 之 间 是 分 割 的 ， 没 有 一 个 人 能 够 完全 理 
解 这 两 个 方面 。 但 是 ， 这 种 孤立 式 的 理解 正在 发 生 着 变化 ， 因 为 有 更 


多 的 人 开始 去 理解 如 何 编写 和 部 署 Java 代 码 、 调 优 JVM 并 认识 虚拟 化 
的 各 个 方面 和 复杂 的 服务 器 硬件 架构 。 

从 根本 上 来 讲 ， 因 为 Java 是 独立 于 操作 系统 的 ， 并 且 它 不 依赖 于 
任何 硬件 ， 所 以 它 是 完美 的 虚拟 化 可 选 对 象 。Java 也 能 从 很 多 的 虚拟 
化 特性 中 受益 ， 如 高 可 用 性 和 不 停机 迁移 。 虚 拟 化 为 Java 平 台所 增加 
的 这 些 灵 活性 对 于 通用 的 Java 平 台 来 说 是 很 重要 的 ， 对 于 大 规模 的 
Java 平 台 来 讲 更 是 如 此 。 在 大 规模 的 Java 平 台中 ， 我 们 经 常会 看 到 几 
千 个 JVM 需 要 不 断 地 进行 管理 ， 如 启动 、 停 止 以 及 在 不 停机 的 情况 下 
进行 更 新 。 如 果 没 有 虚拟 化 所 带 来 的 灵活 性 ， 这 种 类 型 的 管理 活动 无 
法 适应 如 此 大 的 规模 。 企 业 级 Java 应 用 需要 动态 扩展 性 、 快 速 供 应 ， 
对 于 如 今 的 开发 和 运 维 团队 来 讲 ，HA 正 成 为 日 益 重 要 的 关注 点 。 完 全 
基于 传统 硬件 的 平台 来 实现 这 些 需 求 会 非常 复杂 并 且 成 本 高 昂 。 虚 拟 
化 是 一 种 突破 性 的 技术 ， 它 减轻 了 企业 组 织 中 常见 的 企业 级 Java 应 用 
需求 所 面临 的 压力 。 

客户 希望 虚拟 化 的 方式 能 够 减少 服务 器 的 数量 。 与 此 同时 ， 客 户 
也 希望 借助 合并 的 机 会 来 合理 化 某 个 特定 负载 所 使 用 的 中 间 件 组 件 的 
数量 。 中 间 件 组 件 通常 会 运行 在 JVM 之 中 ， 并 且 规 模 是 成 百 上 千 个 的 
JVM 实 例 ， 所 以 这 就 提供 了 很 多 机 会 来 进行 JVM 实 例 合 并 。 因 此 ， 中 
间 件 的 虚拟 化 会 带 来 两 次 合并 的 机 会 ， 首 先是 合并 服务 器 实例 ， 然 后 
是 合并 JVM 实 例 。 这 种 趋势 得 到 了 业界 广泛 认同 ， 毕 竟 所 有 的 IT 厂商 
都 在 考虑 合并 所 带 来 的 成 本 节省 问题 。 

本 书 不 会 大 规模 地 、 深 入 地 介绍 虚拟 化 技术 ， 但 是 出 于 全 面 性 考 
虑 ， 本 书 会 有 针对 性 地 引入 虚拟 化 概念 与 Java 结 合 的 性 能 调 优 策略 。 

1.3.3.3 多 核 技 术 

随 着 多 核 、 线 程 、 异 构 技 术 等 技术 的 不 断 发 展 ， 我 们 对 于 Java 程 
序 的 优化 方式 已 经 不 单单 是 单一 的 JVM 调 优 、Java 代 码 编写 优化 ， 它 
已 经 快速 地 进入 到 综合 因素 优化 层面 。 

单线 程 的 Java 应 用 程序 无 法 充分 利用 现代 CPU 架构 上 额外 的 硬件 
线程 。 那 些 单线 程 应 用 必须 按照 多 线程 的 方式 重 构 才 能 并 行 工 作 。 此 
外 ， 很 多 Java 应 用 程序 都 有 单线 程 阶段 或 操作 ， 尤 其 是 初始 化 或 启动 
阶段 。 通 过 并 行 执行 程序 、 同 时 利用 多 个 线程 ， 这 些 Java 应 用 程序 的 
初始 化 或 启动 性 能 将 大 幅 提升 。 


多 核 处 理 器 是 单 枚 心 片 〈 也 称 为 “ 硅 核 2” ， 能 够 直接 插入 单一 的 
处 理 器 插 模 中， 但 操作 系统 会 利用 所 有 相关 的 资源 ， 将 它 的 每 个 执行 
内 核 作 为 分 立 的 逻辑 处 理 器 。 通 过 在 两 个 执行 内 核 之 间 划 分 任务 ， 多 
核 处 理 器 可 在 特定 的 时 钟 周期 内 执行 更 多 任务 。 多 核 技 术 能 够 使 服务 
器 并 行 处 理 任务 ， 而 在 以 前 ， 这 可 能 需要 使 用 多 个 处 理 器 ， 多 核 系统 
更 易于 扩充 ， 并 且 能 够 在 更 纤巧 的 外 形 中 融入 更 强大 的 处 理性 能 ， 这 
种 外 形 所 用 的 功 耗 更 低 、 计 算 功 耗 产生 的 热量 更 少 。 多 核 技 术 是 处 理 
器 发 展 的 必然 近 20 年 来 ， 推 动 微 处 理 器 性 能 不 断 提 高 的 因素 主要 有 两 
^: 半导体 工艺 技术 的 飞速 进步 和 体系 结构 的 不 断 发 展 。 半 导体 工艺 
技术 的 每 一 次 进步 都 为 微 处 理 器 体系 结构 的 研究 提出 了 新 的 问题 ， 开 
性 了 新 的 领域 ,体系 结 构 的 进展 又 在 半导体 工艺 技术 发 展 的 基础 上 进 
一 步 提 高 了 微 处 理 器 的 性 能 。 这 两 个 因素 是 相互 影响 ， 相 互 促进 的 。 

1.3.3.4 异 构 计 算 

异 构 计 算 技 术 从 20 世 纪 80 年 代 中 期 产生 ， 由 于 它 能 经 济 有 效 地 获 
取 高 性 能 计算 能 力 、 可 扩展 性 好 、 计 算 资 源 利 用 率 高 、 发 展 潜力 巨 
大 ， 目 前 已 成 为 并 行人 分 布 计算 领域 中 的 研究 热点 之 一 。 伴 随 着 GPU 
技术 的 不 断 发 展 、 成 熟 ， 异 构 染 构 这 个 名 词 开 始 进 入 到 密集 型 计算 需 
求 的 应 用 程序 范畴 中 ， 特 别 是 针对 视频 分 析 、 科 学 计算 这 些 应 用 场 
景 ， 异 构架 构 服 务 器 已 经 进入 稳定 发 展期 。 异 构 计 算 的 英文 名 称 是 
Heterogeneous Computing ， 主 要 是 指使 用 不 同类 型 指令 集 和 体系 架构 
的 计算 单元 组 成 系统 的 计算 方式 ， 常 见 的 计算 单元 类 别 包 括 CPU、 
GPU 等 协 处 理 器 、DSP、ASIC、FPGA 等 。 

在 异 构 计 算 系 统 上 进行 的 并 行 计算 通常 称 为 异 构 计算 。 人 们 已 从 
不 同 角 度 对 异 构 计算 进行 定义 ， 综 合 起 来 我 们 给 出 如 下 定义 : 异 构 计 
算是 一 种 特殊 形式 的 并 行 和 分 布 式 计算 ， 它 或 是 用 能 同时 支持 SIMD 方 
式 和 MIMD 方 式 的 单个 独立 计算 机 ， 或 是 用 由 高 速 网 络 互 连 的 一 组 独 
立 计 算 机 来 完成 计算 任务 。 它 能 协调 地 使 用 性 能 、 结 构 各 异地 机 器 以 
满足 不 同 的 计算 需求 ， 并 使 代码 (或 代码 段 ) 能 以 获取 最 大 总 体 性 能 
方式 来 执行 。 

1.3.3.5 高 速 网 络 技术 

在 网 络 世 界 里 ， 无 论 出 现 怎样 的 新 技术 ， 基 础 部 分 都 不 会 太 大 的 
变化 ， 无 非 是 在 某 些 地 方 对 某 些 功能 分 而 化 之 ， 或 是 恰恰 相反 ， 将 某 


些 地 方 的 某 些 功能 整 而 合 之 ， 使 它们 周而复始 地 聚 散 离合 而 已 。 正 因 
为 基础 技术 早已 成 型 ， 才 需要 我 们 更 深入 、 更 扎实 地 掌握 它们 。 只 要 
掌握 好 基础 部 分 ， 那 么 无 论 上 层 运 行 的 是 什么 技术 和 设备 ， 我 们 都 能 
够 况 着 应 对 ， 绝 不 会 乱 了 手脚 。 

现代 网 络 设备 已 经 非常 成 熟 ， 各 类 解决 方法 也 一 样 趋 于 成 熟 ， 所 
以 我 们 完全 可 以 基于 不 同 的 应 用 程序 需求 来 设计 适合 自己 应 用 程序 使 
用 的 网 络 环境 。 


1.3.4 架构 方面 


自然 世界 中 ， 先 天 有 缺陷 的 生物 总 是 容易 被 细菌 病毒 入 侵 ， 而 健 
壮 的 生物 更 能 抵抗 细菌 病毒 的 攻击 ， 计 算 机 系统 也 是 一 样 ， 若 有 先天 
的 架构 设计 安全 缺陷 ， 那 么 在 面临 网 络 攻击 的 时 候 ， 就 更 容易 被 入 侵 
或 者 破坏 ， 甚 至 因为 设计 架构 的 原因 ， 有 些 漏洞 完全 没有 办 法 修复 。 

一 般 来 说 ， 兼 容 性 越 好 的 架构 越 能 适应 未 来 变化 的 需要 ， 但 是 
容 性 设计 也 会 带 来 严重 的 安全 楼 ， 例 如 苹果 的 USB-C 接 口 设 计 [34]。 
苹果 的 USB-C 接 口 设 计 产 生 了 一 个 必须 推翻 目 己 才 能 修复 的 漏洞 ， 所 
以 这 是 一 个 糟 糙 的 设计 。 

我 们 通常 认 知 是 ， 如 果 能 以 最 少 的 成 本 实现 系统 ， 那 最 能 体现 设 
计 者 水 平 。 有 些 设计 场景 就 暴露 了 安全 问题 ， 例 如 因为 降 成 本 设计 导 
致 服务 器 无 法 防范 CC 攻击 的 场景 。 很 多 设计 者 会 将 每 人 台 服 务 器 的 负 
载 率 设 定 得 非常 高 ， 高 达 50% 人 70%， 和 希望 减少 服务 器 的 部 署 以 降低 
成 本 ,但 是 在 正常 业务 场景 下 就 有 这 么 高 的 负载 ， 被 CC[35] 攻 击 的 时 
候 会 很 容易 被 瘫痪 ， 安 全 专家 也 没有 办 法 在 服务 器 上 实施 安全 策略 以 
防御 攻击 。 

设计 时 保证 一 定 的 服务 器 匈 余 ， 能 够 降低 攻击 开始 阶段 系统 就 被 
攻击 到 瘫痪 的 概率 ， 也 为 DDoS[36] 安 全 专家 的 安全 防御 策略 提供 计算 
资产。 如 果 有 条 件 的 话 ， 最 好 是 把 业务 部 署 在 云 上 ， 这 样 被 攻击 的 时 
候 可 以 动态 增加 服务 器 数量 ， 既 能 节省 成 本 也 能 保障 攻击 的 时 候 能 够 
有 效 的 防护 。 

数据 和 代码 不 分 离 意 味 着 数据 可 以 被 当成 代码 执行 ， 而 数据 是 可 
以 由 用 户 (攻击 者 ) 自己 定义 的 ， 也 就 是 说 用 户 (攻击 者 ) 可 以 自 定 


义 在 系统 上 执行 的 代码 ， 那 么 攻击 者 可 以 构造 木马 代码 ， 作 为 效 据 输 
入 给 系统 ， 系 统 执行 这 些 木马 代码 后 ， 系 统 就 会 被 攻击 者 控制 ， 这 样 
的 设计 将 给 系统 带 来 极 大 的 风险 。 

设计 模式 要 求 我 们 遵循 对 扩展 开放 ， 对 修改 封闭 的 设计 原则 。 对 
于 修改 封闭 ， 就 是 说 外 部 可 以 调用 系统 的 接口 使 用 系统 的 功能 ， 但 是 
看 不 到 系统 内 部 实现 的 代码 ， 也 不 能 对 内 部 实现 的 代码 进行 修改 。 这 
常常 给 设计 者 一 种 错觉 ， 认 为 外 部 使 用 者 不 知道 系统 内 部 是 怎么 实现 
的 ， 不 知道 存在 的 安全 缺陷 ， 从 而 放心 大 胆 地 在 内 部 留 下 许多 安全 隐 
患 。 

综合 上 面 的 描述 ， 不 管 是 程序 设计 优化 ， 还 是 系统 架构 ， 我 们 都 
需要 把 安全 作为 首要 指标 去 考虑 ， 各 种 遗留 下 来 的 安全 隐患 积累 到 一 
定 程度 ， 或 者 被 某 个 导 火 索 事件 引起 安全 事故 的 大 爆发 ， 导 致 企业 的 
经 营 遭 受 重 创 ! 不 管 是 架构 师 、 研 发 人 员 ， 或 是 安全 人 人员， 都 不 应 该 
让 企业 走 到 这 一 步 绝 境 ， 而 应 该 在 产品 设计 之 初 就 避免 出 现 严重 的 设 
计 安 全 问题 ， 为 保障 产品 的 安全 水 平 打下 基础 。 虽 然 没 有 绝对 安全 的 
系统 ， 但 是 我 们 也 要 向 着 这 个 目标 不 断 去 努力 、 发 展 。 


1.3.5 层次 方面 


性 能 分 析 方 法 最 常用 的 有 两 种 方式 ， 一 种 是 所 谓 的 自 上 而 下 ， 对 
应 的 ， 另 一 种 是 自 下 而 上 。 自 上 而 下 指 的 是 从 应 用 层 开 始 着 手 分 析 、 
查找 性 能 瓶颈 原因 ， 相 反 地 ， 目 下 而 上 指 的 是 从 分 析 CPU、 内 存 、 磁 
盘 IO 等 底层 问题 开始 ， 逐 渐 向 上 直到 应 用 层 ， 逐 渐 地 分 析 、 碍 找 问题 
原因 。 由 于 硬件 、 操 作 系统 、 网 络 设备 的 不 断 发 展 ， 加 之 互联 网 应 用 
群体 的 数量 庞大 ， 导 致 性 能 问题 已 经 不 太 可 能 由 单一 原因 导致 ， 性 能 
优化 技术 逐渐 变化 成 综合 性 问题 ， 对 应 的 Java 优 化 方案 也 需要 综合 性 
考虑 整体 原因 后 才能 提出 解决 方案 。 无 论 自 上 而 下 ， 还 是 自 下 而 上 ， 
不 同 的 方法 可 以 用 来 查找 不 同类 型 的 性 能 问题 ， 如 图 1-5 所 示 。 


图 1-5 两 种 性 能 调 优 方法 

1.3.5.1 自 上 而 下 

自 上 而 下 方法 通常 从 应 用 层 开 始 分 析 、 查 找 问题 的 原因 。 由 于 每 
天 使 用 应 用 层 的 人 群 数 量 不 同 、 网 络 状态 不 同 、 应 用 层 的 配置 可 能 不 
同等 外 部 干扰 因素 ， 所 以 我 们 有 必要 对 应 用 层 软 件 进行 监控 ， 监 控 所 
有 用 户 的 使 用 过 程 ， 这 样 可 以 帮助 发 现 是 什么 原因 导致 了 性 能 下 降 。 
应 用 层 的 监控 包括 了 Java 虚 拟 机 、 中 间 件 、 数 据 库 等 ， 同 时 也 需要 监 
控 操 作 系 统 的 变化 来 帮助 定位 问题 。 基 于 这 些 监控 数据 ， 我 们 可 以 有 
效 地 对 Java 人 代码、JVM 配 置 选项 、JVM 垃 圾 收集 器 等 与 Java 相 关 的 方 
面 进 行 调 优 。 

1.3.5.2 自 下 而 上 

目下 而 上 方法 是 从 最 底层 的 硬件 配置 开始 逐渐 向 上 的 方式 进行 分 
析 、 查 找 性 能 问题 的 原因 。 由 于 虚拟 化 技术 的 不 同 引 入 、 强 化 ， 我 们 
已 经 不 再 是 对 单一 的 CPU、 内 存 、 硬 盘 、 网 络 等 资源 进行 管理 、 应 
用 ， 我 们 可 以 通过 虚拟 化 技术 虚拟 出 一 块 资源 ， 所 以 不 同 的 虚拟 资源 
可 以 带 来 不 同 的 性 能 ， 这 就 需要 我 们 对 底层 资源 进行 监控 。 监 控 的 数 
据 包 括 CPU 指 令 集 、CPU 缓 存 、 磁 盘 缓存 等 。 


1.4 本 章 小 结 


本 章 首先 介绍 了 为 什么 我 们 需要 性 能 调 优 ， 通 过 12306、 奥 运 会 票 
务 系统 、B2C 网 站 等 例子 让 读者 能 够 明日 性 能 优化 的 重要 性 和 必要 
性 。 然 后 通过 对 性 能 的 参考 指标 介绍 ， 让 读者 了 解 性 能 优 劣 的 评判 依 
据 。 接 下 来 ， 对 性 能 调 优 进行 分 类 ， 按 照 基 础 技术 、 系 统 染 构 、 层 次 


序列 等 三 个 方法 进行 性 能 优化 。 通 过 对 本 章 的 阅读 ， 读 者 可 能 可 以 明 
确 阅读 本 书 的 目的 ， 然 后 通过 第 2 章 的 预备 知识 ， 对 性 能 调 优 开始 前 的 
基础 技术 有 一 定 的 了 解 。 


[1]1 Java SE(Java Platform,Standard Edition);Java EE(Java Platform,Enterprise Edition); Java ME(Java Platform,Micro 
Edition). 


[2] 例如 金融 系统 ， 不 能 单纯 按照 程序 员 的 思维 设计 系统 和 数据 库 结构 ， 而 是 应 该 更 加 紧密 地 与 业务 结合 。 


[3] 12306: 中 国 铁路 客户 服务 中 心 (12306 网 ) 是 铁路 服务 客户 的 重要 窗口 ， 将 集成 全 路 客 货 运输 信息 ， 为 社会 和 铁路 
客户 提供 客 货运 输 业 务 和 公共 信息 查询 服务 。 


[4] 来 源 2013 年 的 网 络 数据 ， 作 者 非 阿里 人 士 ， 也 没有 淘宝 账户 ， 所 以 数据 不 准确 请 读者 见谅 。 
[5] PV: 即 页 面 浏览 量 ， 通 常 是 衡量 一 个 网 络 新 闻 频 道 或 网 站 甚至 一 条 网 络 新 闻 的 主要 指标 。 
[6] 摘自 2013 年 的 官方 数据 。 

[7] 提高 系统 并 发 吞吐 能 力 的 方式 ， 第 5 章 会 详细 介绍 。 


[8] 蒂 姆 . 库 克 (Tim Cook) ，1960 年 11 月 1 日 出 生 于 美国 阿拉 巴 马 州 ，1982 年 毕业 于 奥 本 大 学 工业 工程 专业 。1988 年 获 
得 杜 克 大 学 企业 管理 硕士 学 位 。 曾 在 IBM 供 职 12 年 ， 负 责 PC 部 门 在 北美 和 拉美 的 制造 和 分 销 运作 。1998 年 年 初 ， 库 克 
进入 苹果 ， 任 副 总 裁 ， 主 管 苹果 的 电脑 制造 业务 。2011 年 接替 乔布斯 担任 苹果 公司 CEO。 


[9] 即 乔布斯 ，1955 年 02 月 24 日 一 2011 年 10 月 05 日 。 
[10] B2C:Business To Customer. 
[11] 一 个 高 性 能 的 HTTP 和 反 向 代理 服务 器 ， 也 是 一 个 IMAP/POP3/SMTP 服 务 器 。 


[12] 肯 : 汤 普 森 (Kenneth Lane Thompson，1943 年 2 月 4 日 ) ， 一 般 称 之 为 Ken Thompson， 为 美国 计算 机 科学 学 者 ， 与 
丹尼斯 .里 奇 同 为 1983 年 图 灵 奖 得 主 。 


[13] LISP 是 一 种 通用 高 级 计算 机 程序 语言 ， 长 期 以 来 垄断 人 工 智能 领域 的 应 用 。Lisp 作 为 因应 人 工 智能 而 设计 的 语言 ， 
是 第 一 个 函数 式 程序 设计 语言 ， 有 别 于 C、Fortran 等 命令 式 程序 设计 语言 和 Java、C # 等 面向 对 象 语言 。 


[14] 保罗 .格雷 厄 姆 (Paul Graham) ， 美 国 著名 程序 员 、 风 险 投资 家 、 博 客 和 技术 作家 。 他 以 Lisp 方 面 的 工作 而 知名 ， 
也 是 最 早 的 Web 应 用 Viaweb 的 创办 者 之 一 ， 后 来 以 近 5 千 万 美元 的 价格 被 雅虎 收购 ， 成 为 Yahoo! Store. 


[15] 艾 伦 . 麦 席 森 .图 灵 (Alan Mathison Turing) ， 生 于 1912 年 6 月 23 日 ， 逝 于 1954 年 6 月 7 日 ， 被 誉 为 “计算 机 科学 之 父 ” 
和 “人 工 智 能 之 父 >。 图 灵 和 同事 破译 的 情报 ， 在 盟 军 诺曼底 登陆 等 重大 军事 行动 中 发 挥 了 重要 作用 ， 图 灵 因 此 在 1946 年 
获得 “不 列 颠 帝国 勋章 ”。 历 史学 家 认为 ， 他 让 二 战 提 早 了 2 年 结束 ， 拯 救 了 至 少 1400 万 人 的 生命 。 


[16] 3-38 fX. (John von Neumann, 1903—1957) ，20 世 纪 最 重要 的 数学 家 之 一 ， 在 现代 计算 机 、 博 弈 论 和 核武 器 等 
诸多 领域 内 有 杰出 建树 的 最 伟大 的 科学 全 才 之 一 ， 被 称 为 “计算 机 之 父 * 和 “博弈 论 之 父 ”。 


[17] 二 维 数组 以 上 的 数组 ， 既 非 线性 也 非 平面 的 数组 。 


[18] 在 计算 机 科学 中 ， 二 叉 树 是 每 个 节点 最 多 有 两 个 子 树 的 树 结构 。 通 常 子 树 被 称 作 “ 左 子 树 ” (left subtree) AAF 
bi" (right subtree) 。 二 叉 树 常 被 用 于 实现 二 叉 查 找 树 和 二 叉 堆 。 


[19] Solid State Drives， 简 称 固 盘 ， 固 态 硬 盘 (Solid State Drive) 用 固态 电子 存储 芯片 阵列 而 制 成 的 硬盘 ， 由 控制 单元 
AFAT (FLASHA, DRAMA) HR 


[20] — PHZ RHEA A F192, USAIHBASR, T ZEMIRIT ESFRERGERRASBURT. ENTRA 
中 的 最 佳 编码 方法 ，deflate 等 压缩 算法 也 结合 了 huffman 算 法 。 


[21] 即 巴 莱 多 定律 中 一 小 部 分 ，， 是 19 世 纪 末 约 20% ， 其 余 20 世 纪 初 意 大 80% 尽 管 是 多 数 利 经 济 学 家 巴 莱 ， 却 是 次 要 
的 ， 多 发 现 的 。 他 认 因此 又 称 二 八 定 为 ， 在 任何 一 律 。 组 东西 中 ， 最 重要 的 只 占 其 


[22] 以 C 语 言 为 例 。 


[23] DNS (Domain Name System, RERA) ， 因 特 网 上 作为 域名 和 IP 地 址 相互 映射 的 一 个 分 布 式 数据 库 ， 能 够 使 用 户 
更 方便 的 访问 互联 网 ， 而 不 用 去 记 住 能 够 被 机 器 直接 读 取 的 IP 数 串 。 


[24] CDN (Content Delivery Network， 内 容 分 发 网 络 ) ， 其 基本 思路 是 尽 可 能 避 开 互联 网 上 有 可 能 影响 数据 传输 速度 和 
稳定 性 的 瓶颈 和 环节 ， 使 内 容 传 输 的 更 快 、 更 稳定 。 

[25] 与 目前 常见 的 集中 式 存储 技术 不 同 ， 分 布 式 存储 技术 并 不 是 将 数据 存储 在 某 个 或 多 个 特定 的 节点 上 ， 而 是 通过 网 络 
使 用 企业 中 每 台 机 器 上 的 磁盘 空间 ， 并 将 这 些 分 散 的 存储 资源 构成 一 个 虚拟 的 存储 设备 ， 数 据 分 散 的 存储 在 企业 的 各 个 
角落 。 

[26] 具体 请 参考 有 关 Linux 服 务 器 的 相应 技术 书籍 。 


[27] 泛 指 非 关系 型 的 数据 库 ，NoSQL 数据库 的 产生 就 是 为 了 解决 大 规模 数据 集合 多 重 数据 种 类 带 来 的 挑战 ， 尤 其 是 大 数 
据 应 用 难题 。 

[28] 即 High Availability， 指 的 是 通过 尽量 缩短 因 日 常 维护 操作 (计划 ) 和 突 发 的 系统 崩溃 (EHR) 所 导致 的 停机 时 
间 ， 以 提高 系统 和 应 用 的 可 用 性 。 它 与 被 认为 是 不 间断 操作 的 容错 技术 有 所 不 同 。HA 系 统 是 目前 企业 防止 核心 计算 机 
系统 因 故 障 停机 的 最 有 效 手段 。 

[29] 一 个 开源 的 应 用 容器 引擎 ， 让 开发 者 可 以 打包 他 们 的 应 用 以 及 依赖 包 到 一 个 可 移植 的 容器 中 ， 然 后 发 布 到 任何 流行 
的 Linux 机 器 上 ， 也 可 以 实现 虚拟 化 。 

[30] 数据 的 热点 单 点 问题 由 于 其 独 有 的 高 访问 特性 ， 在 性 能 上 一 直 都 是 一 大 难题 。 

[31] 一 个 由 Apache 基 金 会 所 开发 的 分 布 式 系统 基础 架构 。 

[32] UC Berkeley AMP lab 所 开源 的 类 HadoopMapReduce 的 通用 的 并 行 ，Spark， 拥 有 HadoopMapReduce 所 具有 的 优 
m; 但 不 同 于 MapReduce 的 是 Job 中 间 输 出 结果 可 以 保存 在 内 存 中 ， 从 而 不 再 需要 读 写 HDFS， 因 此 Spark 能 更 好 地 适用 
于 数据 挖掘 与 机 器 学 习 等 需要 迭代 的 MapReduce 的 算法 。 

[33] Azul Systems 公 司 推出 的 JVM ( 取 名 Zing) ，Zing 引 入 了 一 系列 优秀 的 垃圾 收集 机 制 ， 使 得 应 用 系统 能 尽情 使 用 需 
要 的 内 存 容 量 ， 而 不 会 让 pasue time 太 长 。 唯一 的 不 足 瑶 似 Zing 是 非 开 源 ， 但 作为 开源 项 目 可 以 免费 使 用 。 

[34] 只 要 将 特制 的 U 盘 插入 使 用 USB-C 接 口 的 苹果 计算 机 ， 攻 击 者 无 须 在 做 任何 操作 ， 就 可 以 将 后 门 或 是 病毒 自动 植 入 
苹果 计算 机 ， 使 计算 机 可 以 被 攻击 者 远程 控制 或 是 通过 病毒 自动 破坏 计算 机 内 的 文件 。 

[35] CC (Challenge Collapsar) 是 一 种 http 层 的 DDoS 攻击 ， 它 通过 发 送 大 量 http 层 的 请 求 ， 以 达到 让 被 攻击 的 目标 网 站 
EH BAY. 


[36] 分 布 式 拒绝 服务 (DDoS: Distributed Denial of Service) 攻击 指 借助 于 客户 /服务 器 技术 ， 将 多 个 计算 机 联合 起 来 作 
为 攻击 平台 ， 对 一 个 或 多 个 目标 发 动 DDoS 攻击 ， 从 而 成 倍 地 提高 拒绝 服务 攻击 的 威力 。 


第 2 章 优化 前 的 准备 知识 


19 世 纪 70 年 代 ， 恩 格 斯 根据 当时 自然 科学 发 展 所 显示 的 突破 原 有 
学 科 界 限 的 新 趋势 ， 在 分 析 各 种 物质 运动 形态 相互 转化 的 基础 上 指 
出 ， 原 有 学 科 的 邻接 领域 将 是 新 学 科 的 生长 点 。 此 后 在 物理 学 、 化 
学 、 生 物 学 、 地 质 学 、 天 文学 等 原 有 基础 学 科 相 互 交 界 的 领域 产生 出 
了 一 系列 的 边缘 学 科 ， 如 物理 化 学 、 生 物化 学 、 生 物 物 理 。 笔 者 认 
为 ， 计 算 机 软件 设计 也 是 一 个 可 以 归 为 “边缘 科学 ”的 学 科 ， 它 需要 计 
算 机 技术 与 其 他 领域 有 联系 后 才能 产生 真正 的 价值 ， 这 样 这 款 软件 才 
会 拥有 属于 它 自己 的 用 户 ， 才 会 存在 软件 生命 周期 。 

随 着 互联 网 时 代 的 到 来 ， 计 算 机 需要 管理 的 数据 量 呈 指数 级 别 地 
飞速 上 涨 ， 我 们 的 系统 所 需要 支持 的 用 户 数 、 数 据 量 ， 很 可 能 在 短 短 
的 一 个 月 内 突然 爆发 式 地 增长 几 千 、 几 万 倍 ， 数 据 也 很 可 能 快速 地 从 
原来 的 几 百 GB 飞速 上 涨 到 了 几 百 个 TB。 如 果 在 这 爆发 的 关键 时 刻 ， 系 
统 不 稳定 或 无 法 访问 ， 那 么 对 于 业务 将 会 是 毁灭 性 的 打击 。 这 样 看 
来 ， 计 算 机 软件 技术 已 经 不 再 是 单一 的 技术 ， 它 已 经 发 展 成 为 整合 了 
硬件 、 网 络 、 系 统 架构 、 虚 拟 化 、 分 布 式 计算 诸多 因素 混合 的 一 个 综 
合 性 知识 领域 。 因 此 ， 我 们 对 系统 的 性 能 优化 也 需要 考虑 诸多 因素 ， 
这 也 就 需要 我 们 对 应 用 软件 相关 的 多 个 领域 的 知识 进行 深入 了 解 、 理 
解 。 

基于 Java 平 台 的 应 用 服务 器 、 企 业 服务 总 线 、 消 息 中 间 件 、 流 程 引 
擎 这 些 企 业 应 用 的 关键 运行 平台 还 会 在 一 段 时 间 内 被 广泛 使 用 。 但 是 
随 着 硬件 技术 的 飞速 发 展 ， 以 及 新 的 应 用 模式 和 商业 模式 例如 SOA、 
云 计 算 的 出 现 和 成 熟 ， 面 向 企业 应 用 的 开发 语言 越 来 越 需 要 关注 并 行 
计算 、 多 核 编 程 、 极 限 事务 处 理 等 。 例 如 金融 行业 ，Java 正 在 逐步 走 入 
金融 核心 领域 ， 很 多 集成 商 和 行业 最 终 用 户 都 在 基于 Java 和 SOA 做 银行 
的 新 一 代 核 心 。 而 且 轻 量 级 的 IOC 容 器 、0OSGi 的 应 用 服务 期 已 经 逐步 
成 为 主流 ， 尤 其 是 在 云 计算 的 大 环境 下 ， 企 业 应 用 逐渐 互联 网 化 ， 因 
此 云 化 是 大 势 所 趋 。 

计算 机 的 发 展 创造 了 Internet， 但 是 计算 机 现在 却 不 是 访问 Internet 
的 唯一 方式 。 智 能 化 的 消费 类 电子 产品 打破 了 PC 作为 信息 终端 的 垄断 


地 位 ， 成 为 人 类 进入 Internet 的 新 门户 。 信 息 终 端的 多 元 化 预示 着 所 谓 
后 PC 时 代 的 到 来 。 消 费 类 的 信息 终端 量 大 面 广 ， 是 典型 的 瘦 客 户 机 ， 
其 本 身 的 资源 和 能 力 不 能 与 PC 相 比 ， 但 必须 更 加 智能 化 ， 并 对 服务 器 
端的 管理 提出 了 更 高 的 要 求 。 基 于 Java 的 安 卓 操作 系统 能 运行 在 16 位 以 
上 的 微 处 理 器 上 ， 占 用 内 存 少 ， 可 以 在 资源 有 限 的 设备 商 方便 地 开发 
出 各 种 各 样 的 应 用 ， 直 接 运 行 在 不 同 的 消费 类 或 其 他 电子 设备 上 。Jini 
的 出 现 为 Java 网 络 连接 提供 了 公共 标准 ， 使 得 任何 Java 设 备 都 可 以 连 入 
网 络 中 被 自动 识别 ， 并 可 充分 利用 网 络 上 已 有 的 各 种 资源 。 计 算 的 网 
络 化 、 峰 入 化 、 部 件 化 这 三 大 趋势 是 紧密 联系 的 。Java 和 作为 Java 扩 展 
的 Jini 技 术 将 为 这 三 者 的 结合 找到 合适 的 纽带 。Java 绝 不 仅仅 是 一 种 语 
言 ，Java 和 作为 Java 扩 展 的 Jini 是 一 个 分 布 式 的 ， 部 件 化 的 ， 可 广泛 运 
用 于 从 服务 器 、PC 机 到 机 项 盒 、 微 波 炉 、 智 能 卡 等 多 种 设备 的 、 与 操 
作 系 统 无 关 的 优秀 网 络 计 算 平 台 。 

Java 系 统 主要 的 展示 有 : 应 用 工具 、 应 用 系统 、 信 息 家 电 等。 特别 
在 实时 系统 开发 方面 ， 以 IBM 为 首开 发 出 了 应 用 于 工业 实时 环境 的 Java 
藤 入 系统 ， 展 现 出 Java 在 工业 领域 的 广阔 应 用 前 景 。 

Java 语 言 的 出 现 和 发 展 ， 得 到 了 IT 业界 的 青睐 。 作 为 一 种 与 底层 硬 
件 无 关 的 , “编写 一 次 、 到 处 运行 ”的 高 级 语言 和 计算 平台 ，Java 天 生 就 
具有 将 网 络 上 的 各 个 平台 连 成 一 体 的 能 力 ， 优 秀 的 多 线程 设计 也 是 Java 
语言 的 一 大 特色 ， 多 平台 的 支持 是 其 他 编程 语言 所 无 法 比拟 的 。Java 语 
言 最 初 并 不 是 为 网 络 环境 设计 的 ， 用 户 能 用 它 编写 独立 的 桌面 应 用 程 
序 ， 在 这 个 领域 Java 已 经 被 广大 厂商 接受 ， 如 Oracle 数 据 库 、Eclipse 工 
具 都 是 使 用 Java 语 言 编写 的 。 当 网 络 出 现 以 后 ， 由 于 网 络 软 硬件 环境 的 
复杂 性 ， 常 见 的 编程 语言 不 能 适应 这 种 环境 的 要 求 ， 而 Java 语 言 的 平台 
无 关 性 的 特性 正好 适用 于 网 络 这 个 潮流 。 

本 章 主 要 介绍 和 解决 以 下 问题 ， 这 些 也 是 优化 之 前 的 准备 知识 : 

m 什么 是 内 存 、CPU、GPU、 硬 盘 、 网 络 ，Java 程 序 怎 么 样 才 能 
好 地 利用 它们 。 

m 那些 高 大 上 的 技术 ， 集 群 技术 、 云 计算 技术 、 分 布 式 技术 、 虚 拟 
化 技术 ， 它 们 是 什么 。 

m 为 第 3 章 开 始 的 具体 编程 、 原 理 讲解 做 准备 。 


2.1 服务 器 知识 


如 果 把 社区 比 作 一 个 云 计 算数 据 中 心 ， 每 个 社区 里 面 都 建 了 很 多 
房子 ， 这 些 房子 有 些 是 固定 的 ， 有 些 是 临时 的 ， 临 时 的 房子 随时 等 待 
拆除 ， 房 子 和 房子 之 间 有 很 多 的 道路 联通 ， 某 些 房子 还 被 用 于 其 他 用 
途 ， 比 如 垃圾 处 理 、 发 电 ， 诸 如 此 类 。 我 们 可 以 把 房子 想象 成 为 内 存 
或 者 硬盘 ， 这 取决 于 房子 是 否 是 固定 的 (临时 的 是 内 存 ， 固 定 的 是 硬 
盘 ) ， 可 以 把 道路 想象 成 为 网 络 ， 把 某 些 特定 房子 想象 成 为 CPU、 
GPU， 这 些 组 成 了 我 们 本 节 需 要 讨论 的 知识 ， 即 服务 器 相关 知识 。 


2.1.1 内 存 


室 无 疑问 ， 内 存 无 论 在 最 初 的 大 型 机 ， 还 是 在 现代 微型 计算 机 世 
界 ， 都 一 直 占 据 着 至 关 重 要 的 地 位 。 任 何 处 于 运行 过 程 中 的 程序 或 者 
数据 都 需要 依靠 内 存 作 为 存储 介质 ， 人 否则 程序 将 无 法 正常 运行 ， 数 据 
在 持久 化 之 前 也 没有 暂时 居住 地 点 。 与 C/C++ 语 言 相 比 ， 使 用 Java 语 言 
编写 的 程序 并 不 需要 程序 员 显 式 地 为 每 一 个 对 象 都 编写 对 应 的 内 存 分 
配 和 内 存 回收 等 相关 函数 ， 拥 有 这 样 的 便捷 主要 是 得 益 于 JVM 的 自动 
内 存 管理 机 制 ， 让 Java 程 序 员 可 以 从 内 存 管理 中 解放 出 来 ， 只 需要 关注 
于 自身 业务 即 可 ， 这 也 就 让 一 些 程序 员 误 认 为 Java 语 言 门槛 低 ， 稍 加 培 
训 就 可 以 上 岗 的 错误 观点 。 

尽管 JVM 的 自动 内 存 管理 机 制 大 大 提升 了 Java 程 序 员 的 编程 效率 ， 
甚至 从 某 种 意义 上 来 说 降低 了 内 存 泄漏 和 内 存 洲 出 的 风险 ， 但 是 如 果 
Java 程 序 员 过 度 依赖 于 自动 化 内 存 管理 机 制 ， 那 么 最 严重 的 就 是 会 弱化 
Java 程 序 员 在 程序 出 现 内 存 洪 出 时 定位 及 解决 问题 的 能 力 ， 最 终 导致 
Java 程 序 员 完全 无 法 自己 处 理 内 存 港 漏 这 些 严 重 性 能 缺陷 。 只 有 当 我 们 
真正 了 解 JVM 如 何 管理 内 存 后 ， 才 能 够 在 遇见 OutOfMemory 错 误 时 ， 
快速 地 根据 错误 异常 日 志 信息 定位 和 解决 问题 。 

除了 下 面 要 深入 讨论 的 JVM 内 存 区 域 以 外 ， 我 们 也 可 以 直接 访问 
内 存 ， 例 如 JDK 在 NIO 类 中 实现 了 一 种 基于 通道 与 缓冲 区 的 1/O 方 式 ， 
它 可 以 使 用 Native 冰 数 库 [1] 直 接 分 配 堆 外 内 存 ， 然 后 通过 一 个 存储 在 
Java 堆 中 的 DirectByteBuffer 对 象 〈 既 想 要 跟 JVM 相 同 进程 内 的 存 取 ， 又 
希望 不 占用 堆 内 存 ， 可 以 选择 采用 DirectByteBuffer 类 ) 作为 这 块 内 存 


的 引用 进行 操作 。 直 接 内 存 的 分 配 不 会 受到 Java 堆 大 小 的 限制 ， 但 是 会 
受到 本 机 内 存 大 小 的 限制 ， 所 有 也 可 能 会 抛 OutOfMemoryError 异 常 。 

我 们 来 讨论 一 下 JVM 对 内 存 区 域 的 使 用 。JVM 的 设计 者 们 之 所 以 
将 JVM 的 内 存 结构 划分 为 多 个 不 同 的 内 存 区 ， 是 因为 每 一 个 独立 的 内 
存 区 都 拥有 各 自 的 用 途 ， 都 会 负责 存储 各 自 的 数据 类 型 ， 其 中 一 些 内 
存 区 的 生命 周期 往往 还 会 和 JVM 的 生命 周期 一 定 程度 上 地 保持 一 致 。 
也 就 是 说 ， 会 伴随 着 JVM 的 启动 而 创建 ， 伴 随 着 JVM 的 退出 而 销毁 。 
而 另 一 部 分 内 存 区 则 是 与 线程 的 生命 周期 保持 一 致 ， 会 伴随 着 线程 的 
开始 而 创建 ， 伴 随 着 线程 的 消亡 而 销毁 。 尽 管 不 同 的 内 存 区 在 存储 类 
型 和 生命 周期 上 有 一 定 的 区 别 ， 却 都 拥有 一 个 相同 的 本 质 ， 即 存储 程 
序 的 运行 时 数据 。 

Java 程 序 对 内 存 分 配 的 方式 一 般 有 三 种 : 

(1) 从 静态 存储 区 域 分 配 。 内 存在 程序 编译 的 时 候 就 已 经 分 配 
好 ， 这 块 内 存在 程序 的 整个 运行 期 间 都 存在 。 例 如 全 局 变量 ，static 变 
量 。 

(2) 在 栈 上 创建 。 在 执行 水 数 时 ， 遂 数 内 局 部 变量 的 存储 单元 都 
可 以 在 栈 上 创建 ， 函 数 执行 结束 时 这 些 存 储 单元 自动 被 释放 。 栈 内 存 
分 配 运算 内 置 于 处 理 器 的 指令 集中 ， 效 率 很 高 ， 但 是 分 配 的 内 存 容量 
有 限 。 

(3) 在 堆 上 分 配 ， 亦 称 动态 内 存 分 配 。 程 序 在 运行 的 时 候 用 
malloc 或 new 申 请 任意 多 少 的 内 存 ， 程 序 员 自己 负责 在 何 时 用 free 或 
delete 释 放 内 存 。 动 态 内 存 的 生存 期 由 我 们 决定 ， 使 用 非常 灵活 ， 但 问 
题 也 最 多 。 

Java 虚 拟 机 内 存 模 型 是 Java 程 序 运 行 的 基础 。Java 虚 拟 机 在 执行 
Java 程 序 的 过 程 中 会 把 它 所 管理 的 内 存 划 分 为 若干 不 同 的 数据 区 域 ， 这 
些 区 域 都 有 各 自 的 用 途 以 及 创建 和 销毁 的 时 间 。Java 虚 拟 机 所 管理 的 内 
存 包 几 个 运行 时 数据 区 域 。 为 了 能 使 Java 应 用 程序 正常 运行 ，JVM 虚 拟 
机 将 其 内 存 数 据 分 为 程序 计数 器 、 虚 拟 机 栈 、 本 地 方法 栈 、Java 堆 和 方 
法 区 这 五 个 部 分 。 如 果 根 据 受 访 权 限 的 不 同 ， 我 们 可 以 定义 上 述 几 个 
区 域 分 为 线程 共享 和 线程 私有 两 大 类 。 线 程 共 享 指 的 是 可 以 允许 被 所 
有 的 线程 共享 访问 的 一 类 内 存 区 ， 这 类 区 域 包括 堆 内 存 区 、 方 法 区 、 
运行 时 常量 池 三 个 内 存 区 。 简 单 地 一 句 话 描述 用 途 ， 如 图 2-1 所 示 ， 程 


序 计 数 器 用 于 存放 下 一 条 运行 的 指令 ， 虚 拟 机 栈 和 本 地 方法 栈 用 于 存 
放 函 数 调用 堆栈 信息 ，Java 扒 用 于 存放 Java 程 序 运 行 时 所 需 的 对 象 等 数 
据 ， 方 法 区 用 于 存放 程序 的 类 元 数据 信息 。 其 中 ，Java 堆 (heap) 和 
Java 栈 (stack) 这 两 个 内 存 区 是 大 多 数 Java 程 序 员 最 关注 的 ， 两 个 英文 
单词 连 起 来 读 ， 听 着 像 Hip-Hop[2] 的 感觉 。 


类 装载 子 系统 
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图 2-1 JVM 内 存 管 理 图 
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2.1.1.1 程序 计数 器 

冯 : 诺 伊 曼 计算 机 体系 结构 的 主要 内 容 之 一 就 是 “程序 预存 储 ， 计 算 
机 自动 执行 "*， 处 理 器 要 执行 的 程序 (指令 序列 ) 都 是 以 二 进 制 代码 序 
列 方式 预存 储 在 计算 机 的 存储 器 中 ， 处 理 器 将 这 些 代 码 逐 条 地 取 到 处 
理 器 中 再 译 码 、 执 行 ， 以 完成 整个 程序 的 执行 。 为 了 保证 程序 能 够 连 
续 地 执行 下 去 ，CPU 必 须 具 有 某 些 手段 来 确定 下 一 条 取 址 指令 的 地 
址 ， 程 序 计 数 器 正 是 起 到 这 种 作用 ， 所 以 通常 又 称 之 为 “指令 计数 
Imo 

程序 计数 器 (Program Counter Register) 是 一 块 很 小 的 内 存 空 间 ， 
它 是 运行 速度 最 快 的 存储 区 域 ， 因 为 它 位 于 不 同 于 其 他 存储 区 的 地 方 
一 处 理 器 内 部 。 寄 存 器 的 数量 极其 有 限 ， 所 以 寄存 器 由 编译 器 根据 需 


求 进行 分 配 。 实 际 在 JAVA 应 用 程序 内 部 你 不 能 直接 控制 寄存 器 ， 也 不 
能 在 程序 中 感觉 到 寄存 器 存在 的 任何 迹象 。 我 们 可 以 把 程序 计数 器 看 
作 是 当前 线程 所 执行 的 字 节 码 的 行 号 指示 器 。 在 虚拟 机 的 概念 模型 
里 ， 字 节 码 解释 器 的 工作 就 是 通过 改变 程序 计数 器 的 值 来 选择 下 一 条 
需要 执行 的 字 节 码 指令 ， 分 支 、 循 环 、 跳 转 、 异 常 处理 、 线 程 恢复 等 
基础 功能 都 要 依赖 这 个 计数 器 来 完成 。 

由 于 Java 是 支持 多 线程 的 语言 ， 所 以 当 绪 程 数 量 超过 CPU 数量 时 ， 
线程 之 间 会 自动 根据 时 间 片 [3] 轮 询 方式 抢 革 CPU 资产。 对 于 单 核 CPU 
而 言 ， 每 一 时 刻 只 能 有 一 个 线程 处 于 运行 状态 ， 其 他 线程 必须 被 切换 
出 去 ， 直 到 轮 询 到 自己 才能 使 用 CPU 资源 ， 为 此 ， 每 一 个 线程 都 必须 
用 一 个 独立 的 程序 计数 器 ， 它 被 用 来 记录 下 一 条 需要 执行 的 计算 机 指 
令 。 对 于 多 核 CPU 来 说 ， 可 以 允许 多 个 线程 同时 执行 ， 各 个 线程 之 间 
的 计数 器 互 不 影响 、 独 立 工 作 ， 所 以 程序 计数 器 是 线程 独 有 的 一 块 内 
存 空 间 。 如 果 当 前 线程 正在 执行 一 个 Java 方 法 ， 则 程序 计数 器 记录 正在 
执行 的 Java 字 节 码 地 址 ， 如 果 当 前 线程 正在 执行 一 个 Native 方 法 ， 则 程 
序 计 数 器 为 空 。 根 据 Java 虚 拟 机 定义 来 看 ， 程 序 寄存 器 区 域 是 唯一 一 个 
在 Java 虚 拟 机 规范 中 没有 规定 任何 OutOfMemoryError 情 况 的 区 域 。 简 单 
概括 上 面 的 描述 ， 即 在 多 线程 环境 下 ， 为 了 让 线程 切换 后 能 恢复 到 正 
确 的 执行 位 置 ， 每 条 线程 都 需要 有 一 个 独立 的 程序 计数 器 ， 各 条 线程 
之 间 互 不 影响 、 独 立 存 储 ， 因 此 这 块 内 存 是 线程 私有 的 。 

JVM 的 架构 是 基于 栈 的 ， 即 程序 指令 的 每 一 个 操作 都 要 经 过 入 栈 
和 出 栈 这 样 的 组 合 型 操作 才能 完成 。JVM 中 的 寄存 器 类 似 于 物理 寄存 
器 的 一 种 抽象 模拟 ， 正 如 前 面 说 的 ， 它 是 线程 私有 的 ， 所 以 生命 周期 
与 线程 的 生命 周期 保持 一 致 。 

2.1.1.2 虚拟 机 栈 

虚拟 机 栈 是 一 种 可 以 被 用 来 快速 访问 的 存储 区 域 ， 该 区 域 位 于 通 
用 RAM[4] 里 面 ， 通 过 使 用 它 的 所 谓 的 “ 栈 指 针 ” 可 以 让 我 们 访问 处 理 
器 。 栈 是 一 种 快速 有 效 的 分 配 存 储 方 法 ， 存 取 速 度 仪 次 于 寄存 器 ， 堆 
栈 指针 若 向 下 移动 ， 则 分 配 新 的 内 存 ， 若 向 上 移动 ， 则 释放 那些 内 
存 。 由 于 Java 编 译 器 需要 预先 去 生成 相应 的 内 存 空间 ， 所 以 当 我 们 尝试 
创建 程序 的 时 候 ，Java 编译 器 必须 知道 被 存储 在 栈 内 的 所 有 数据 的 确 
切 大 小 和 生命 周期 ， 以 便 可 以 按照 上 面 陈述 的 分 配 存 储 方法 通过 上 下 


移动 堆栈 指针 来 动态 调整 内 存 空 间 。 我 们 可 以 认为 这 一 约束 限制 了 程 
序 的 灵活 性 ， 所 以 这 就 是 为 什么 只 有 某 些 Java 数 据 ， 特 别 是 对 象 引用 ， 
它 被 存储 在 栈 里 面 ， 而 应 用 程序 内 部 数量 庞大 的 Java 对 象 没有 被 存储 在 
虚拟 机 栈 里 面 。 

总 的 来 说 ， 栈 的 优势 是 存 取 速 度 比 堆 要 快 ， 它 仅 次 于 寄存 器 ， 并 
且 栈 数据 是 可 以 被 共享 的 。 栈 的 缺点 是 存储 在 栈 里 面 的 数据 大 小 与 生 
存 期 必须 是 确定 的 ， 从 这 一 点 来 看 ， 栈 明显 缺乏 灵活 性 。 虚 拟 机 栈 中 
主要 被 用 来 存放 一 些 基本 类 型 的 变量 ， 例 如 int、short、long、Pbyte、 
float、double、boolean、char， 以 及 对 象 引 用 。 

我 们 前 面 说 过 ， 虚 拟 机 栈 有 一 个 很 重要 的 特殊 性 ， 就 是 存在 栈 中 
的 数据 可 以 共享 。 假 设 我 们 同时 定义 : 


int a 1; 
int b = 1; 


对 于 上 面 的 代码 ， 编 译 器 处 理 第 一 条 语句 ， 首 先 它 会 在 栈 中 创建 
一 个 变量 为 a 的 引用 ， 然 后 查找 栈 中 是 否 有 1 这 个 值 ， 如 果 没 找到 ， 就 
将 1 存放 进来 ， 然 后 将 a 指 向 1。 接 下 来 处 理 第 二 条 语句 ， 在 创建 完 b 的 
引用 变量 后 ， 因 为 在 栈 中 已 经 有 1 这 个 值 ， 便 将 b 直 接 指向 1。 这 样 ， 就 
出 现 了 a 与 b 同 时 均 指 向 1 的 情况 。 这 时 ， 如 果 存 在 第 三 条 语句 ， 它 针对 
a 再 次 定义 为 a=4; 那么 编译 器 会 重新 搜索 栈 中 是 否 有 4 值 ， 如 果 没 有 ， 
则 将 4 存放 进来 ， 并 令 a 指 向 4; 如 果 已 经 有 了 ， 则 直接 将 a 指 向 这 个 地 
址 。 因 此 a 值 的 改变 不 会 影响 到 b 的 值 。 要 注意 这 种 数据 的 共享 与 两 个 
对 象 的 引用 同时 指向 一 个 对 象 的 这 种 共享 的 方式 存在 明显 的 不 同 ， 
为 这 种 情况 a 的 修改 并 不 会 影响 到 b， 它 是 由 编译 器 完成 的 ， 这 样 的 做 
法 有 利于 节省 空间 。 而 一 个 对 象 引 用 变量 修改 了 这 个 对 象 的 内 部 状 
态 ， 会 影响 到 另 一 个 对 象 引 用 变量 。 

与 程序 计数 器 一 样 ，Java 虚 拟 机 栈 也 是 线程 私有 的 内 存 空间 ， 它 和 
Java 线 程 在 同一 时 间 | 创建 ， 它 保存 方法 的 局 部 变量 、 部 分 结果 ， 并 参与 
方法 的 调用 和 返回 。 

Java 庶 拟 机 规范 允许 Java 栈 的 大 小 是 动态 的 或 者 是 固定 不 变 的 。 在 
Java 虚拟 机 规范 中 定义 了 两 种 异常 与 栈 空 间 有 关 ， 即 
StackOverFlowError 和 OutOfMemoryError。 如 果 线 程 在 计算 过 程 中 ， 请 


求 的 栈 深度 大 于 最 大 可 用 的 栈 深度 ， 则 程序 运行 过 程 中 会 抛 出 
StackOverFlowError 异 常 。 如 果 Java 栈 可 以 动态 扩展 ， 而 在 扩展 栈 的 过 
程 中 没有 足够 的 内 存 空 间 来 支持 栈 的 发 展 ， 则 程序 运行 过 程 中 会 抛 出 
OutOfMemeoryError 异 常 。 

我 们 可 以 使 用 -XSS 参 数 来 设置 虚拟 机 栈 的 大 小 ， 栈 的 大 小 直接 决 
定 了 函数 调用 的 可 达 深 度 。 

代码 清单 2-1 所 示 展 示 了 一 个 递归 调用 的 应 用 。 计 数 器 COUNT 记 录 
了 递归 的 层次 ，recusion 方 法 是 一 个 没有 出 口 的 递归 遂 数 ， 通 过 
testStack 方 法 的 调用 ， 该 水 数 会 不 断 地 申请 栈 的 深度 ， 最 终 程序 一 定 会 
导致 虚拟 机 栈 溢 出 。 为 了 方便 记录 测试 数据 ， 程 序 会 在 第 13 行 代码 中 
当 栈 溢出 异常 发 生 时 打印 出 虚拟 机 栈 的 当前 深度 。 


代码 清单 2-1 虚拟 机 栈 示例 代码 TestJVMStack 
public class TestJVMStack { 
private int count = 0; 
// BAB Hse fa Bat 
public void recursion () { 
count++; // 每 次 调用 深度 加 1 


recursion() ;// 递 归 


public void testStack () { 
try{ 
recursion ()} 
}catch (Throwable e) { 
System.out.println ("deep of stack is "tcount);// 打 印 栈 溢出 的 深度 


e.printStackTrace() ; 


} 

public static void main(String[] args) { 
TestStack ts = new TestStack(); 
ts.testStack(); 


} 


清单 2-1 程 序 输出 如 清单 2-2 所 示 ， 笔 者 本 机 运行 的 程序 最 终 在 申请 
到 9013 层 虚拟 机 栈 时 ， 抛 出 异常 。 


代码 清单 2-2 ”代码 2-1 程序 运行 输出 


java.lang.StackOverflowError 


t TestStack.recursion(Tes 
t TestStack.recursion (Tes 
t TestStack.recursion(Tes 


m 


a 
a 
a 
at TestStack. recursion (T 
a 
a 
a 


t TestStack. recursion (Tes 


( 
( 
( 
t TestStack. recursion ( 
( 
( 


t TestStack.recursion (Tes 


tStack. 
tStack.j 
tStack.] 
tStack.] 
tStack.j 
tStack. 
tStack.] 


java: 


java: 


java: 


java: 


) 
) 
) 
java:7) 
:7) 
) 
) 


java:7)deep of stack is 9013 


如 果 系 统 需要 支持 更 深 的 栈 调用 ， 则 可 以 使 用 参数 -Xss1M 运 行程 
序 ， 可 以 扩大 虚拟 机 栈 的 大 小 ， 


1MBo 


刚才 的 配置 扩大 栈 空间 的 最 大 值 为 


如 图 2-2 所 示 ， 虚 拟 机 栈 在 运行 时 使 用 一 种 叫 作 栈 帧 的 数据 结构 保 
存 上 下 文 数据 。 栈 帧 里 面 存放 了 方法 的 局 部 变量 表 、 操 作 数 栈 、 动 态 


连接 方法 和 返回 地 址 等 信息 。 每 


一 个 方法 的 调用 都 伴随 着 栈 帧 的 入 栈 


操作 ， 相 应 地 ， 方 法 的 返回 则 表示 栈 帧 的 出 栈 操作 。 如 果 方 法 调用 
时 ， 方 法 的 参数 和 局 部 变量 相对 较 多 ， 那 么 栈 帧 中 的 局 部 变量 表 融 会 
比较 大 ， 栈 帧 会 不 断 膨 胀 以 满足 方法 调用 所 需 传递 的 信息 增 大 需求 。 
因此 ， 单 个 方法 调用 所 需 的 栈 空 间 大 小 也 会 比较 多 。 
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Java 楼 
图 2-2 虚拟 机 栈 引 用 图 

栈 帧 分 为 三 部 分 ， 局 部 变量 区 (Local Variables) 、 操 作 数 栈 
(Operand Stack) 和 帧 数据 区 (Frame Data) o 

局 部 变量 区 被 定义 为 一 个 从 0 开始 的 数字 数组 ，byte、short、char 
在 存储 前 被 转换 为 int，boolean 也 被 转换 为 int，0 表 示 false， 非 0 表示 
true，long 和 double 则 占据 两 个 字 长 。 局 部 变量 区 是 通过 数组 下 标 访 问 
的 。 

操作 数 栈 也 被 组 织 为 一 个 数字 数组 ， 但 不 同 于 局 部 变量 区 ， 它 不 
是 通过 数组 下 标 访问 的 ， 而 是 能 过 栈 的 Push 和 Pop 操 作 ， 前 一 个 操作 
Push 进 的 数据 可 以 被 下 一 个 操作 Pop 出 来 使 用 。 

帧 数据 区 这 部 分 的 作用 主要 有 以 下 三 点 。 

m 解析 常量 闻 里 面 的 数据 。 

e 方法 执行 完 后 处 理 方法 返回 ， 恢 复 调用 方 现场 。 

m 方法 执行 过 程 中 抛 出 异常 时 的 异常 处 理 ， 存 储 在 一 个 异常 表 ， 当 
出 现 异常 时 虚拟 机 查找 相应 的 异常 表 看 是 否 有 对 应 的 Catch 语 句 ， 如 果 
没有 就 抛 出 异常 终止 这 个 方法 调用 。 
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代码 清单 2-3 所 示人 代码 相 较 于 代码 清 I 1 所 示 代 码 ， 增 加 了 
recursion 方 法 的 参数 ， 用 以 展示 内 部 局 部 变量 增多 之 后 的 变化 。 


代码 清单 2-3 ”虚拟 机 栈 示例 代码 TestJVMStack1 


public class TestJVMStackl { 


private int count = 0; 

// 没 有 出 口 的 递归 函数 

public void recursion(long a,long b,long c) throws InterruptedException{ 
long d=0,e=0, f=0; 
countt++;//#KA ARE Ae 1 


recursion (a,b,c) ;//i#!2 


public void testStack () { 
try{ 
recursion (1L,2L, 31) ; 
}catch (Throwable e) { 
System.out.println("deep of stack is "4count) ; 1/ 打印 栈 溢出 的 深度 


e.printStackTrace () ; 


public static void main(String[] args) { 
TestStack ts = new TestStack(); 
ts.testStack(); 


} 
代码 清单 2-3 代 码 运行 后 的 输出 如 清单 2-4 所 示 。 


代码 清单 -4 代码 2-3 运行 输出 
deep of stack is 3432 
java.lang.StackOverflowError 


at TestStack.recursion(TestStack.java:8) 


从 代码 清单 2-4 的 输出 ， 我 们 可 以 看 到 ， 随 着 代码 传 入 了 多 个 参数 
和 局 部 变量 ， 栈 帧 大 小 就 会 膨胀 。 

在 栈 帧 中 ， 与 性 能 调 优 关系 最 为 密切 的 部 分 就 是 前 面 提 到 的 局 部 
变量 区 。 局 部 变量 区 被 用 于 存放 方法 的 参数 和 方法 内 部 的 引用 。 局 部 
变量 区 以 “ 字 ” 为 单位 进行 内 存 的 划分 ， 一 个 字 为 32 位 长 度 。 对 于 long 和 
double 型 的 变量 ， 则 占用 2 个 字 ， 其 余 类 型 使 用 1 个 字 。 在 方法 执行 时 ， 
虚拟 机 使 用 局 部 变量 区 完成 方法 的 传递 ， 对 于 非 静 态 (static) 方法 ， 
虚拟 机 还 会 将 当前 对 象 (this) 作为 参数 通过 局 部 变量 区 传递 给 当前 方 
"ko 

使 用 jclasslib[5] 工 具 可 以 查看 class 文件 中 每 个 方法 所 分 配 的 最 大 
局 部 变量 区 的 容量 。jclasslib 工 具 是 开源 软件 ， 它 可 以 用 于 查看 class 文 
件 的 结构 ， 包 括 常 量 地 、 接 口 、 属 性 、 方 法 ， 还 可 以 用 于 查看 文件 的 
字 节 码 。 

局 部 变量 区 的 基本 单位 “ 字 ” 对 系统 GC[6] 也 有 一 定 影响 。 如 果 一 个 
局 部 变量 被 保存 在 局 部 变量 区 里 面 ， 那 么 GC 能 引用 到 这 个 局 部 变量 所 
指向 的 内 存 空 间 ， 从 而 在 GC 时 无 法 回收 这 部 分 空间 ， 如 清单 2-5 程 序 所 
To 


代码 清单 .5 虚拟 机 栈 示例 代码 testGC 
public class testGC 1 
public static void testl() 
{ 
byte[] a = new byte[6*1024*1024]; 
} 
System.gc() ; 


System.out.println("first explict gc over"); 


public static void main(String[] args) { 
testGC.testl(); 
} 
} 


清单 2-5 代 码 中 ， 第 4 行 定义 了 一 个 局 部 变量 a， 并 且 它 的 作用 范围 
仅 限 于 大 括号 中 。 在 显示 的 GC 调 用 时 ， 变 量 b 已 经 超过 了 它 的 作用 学 
围 ， 其 对 应 的 堆 空 间 理应 被 回收 。 而 事实 上 ， 由 于 变量 a 仍 在 该 栈 帧 的 
局 部 变量 区 内 ， 因 此 GC 可 以 引用 到 该 内 存 块 ， 阻 碍 了 其 回收 过 程 。 

假设 在 该 变量 失效 后 ， 在 这 个 函数 体内 又 未 能 有 定义 足够 多 的 局 
部 变量 来 复 用 该 变量 所 占 的 基本 单位 * 字 ”， 那 么 在 整个 函数 体内 部 ， 
这 块 内 存 区 域 是 不 会 被 GC 回收 的 。 如 果 遂 数 体 内 的 后 续 操作 非常 费时 
或 者 又 申请 了 较 大 的 内 存 空间 ， 则 对 系统 性 能 将 会 造成 较 大 的 压力 。 
在 这 种 环境 下 ， 可 以 通过 手动 给 要 释放 的 变量 赋值 为 null 的 方法 来 解决 
这 个 潜在 的 性 能 问题 。 

2.1.1.3 本 地 方法 栈 

本 地 方法 栈 (Native Method Stacks) 和 Java 虚 拟 机 栈 的 功能 很 相 
似 ，Java 虚 拟 机 栈 用 于 管理 Java 逊 数 的 调用 ， 而 本 地 方法 栈 用 于 管理 本 
地 方法 的 调用 。 本 地 方法 并 不 是 用 Java 实 现 的 ， 而 是 使 用 C 实 现 的 。 当 
某 个 线程 调用 一 个 本 地 方法 时 ， 他 就 进入 了 一 个 全 新 的 并 且 不 再 受 虚 
拟 机 限制 的 世界 ， 本 地 方法 可 以 通过 本 地 方法 接口 来 访问 虚拟 机 运行 
时 的 数据 区 ， 但 不 止 于 此 ， 它 还 可 以 做 任何 他 想 做 的 事情 。 比 如 ， 它 
甚至 可 以 直接 使 用 本 地 处 理 器 中 的 寄存 器 ， 或 者 直接 从 本 地 内 存 的 堆 


中 分 配 任意 数量 的 内 存 。 总 之 ， 它 和 虚拟 机 拥有 同样 的 权限 (或 者 说 
能 力 ) 。 

本 地 方法 本 质 上 是 依赖 于 实现 的 ， 虚 拟 机 实现 的 设计 者 可 以 自由 
地 决定 使 用 怎样 的 机 制 来 让 Java 程 序 调用 本 地 方法 ， 任 何 本 地 方法 接口 
都 会 使 用 某 种 本 地 方法 栈 。 当 线程 调用 Java 方 法 时 ， 虚 拟 机 会 创建 一 个 
新 的 栈 帧 并 压 入 Java 栈 ， 然 而 当 它 调用 的 是 本 地 方法 时 ， 虚 拟 机 会 保持 
Java 栈 不 变 ， 不 再 在 线程 的 Java 栈 中 讨 入 新 的 帧 ， 虚 拟 机 只 是 简单 地 动 
态 连接 并 直接 调用 指定 的 本 地 方法 。 我 们 可 以 把 这 个 做 法 看 作 是 虚拟 
机 利用 本 地 方法 来 动态 扩展 自己 ， 就 如 同 Java 虚 拟 机 的 实现 是 按照 其 中 
运行 的 Java 程 序 的 顺序 ， 调 用 属于 虚拟 机 内 部 的 另 一 个 (动态 连接 的 ) 
方法 。 我 们 知道 ， 当 C 语 言 编 写 的 程序 调用 一 个 C 函 数 时 ， 其 栈 操 作 都 
是 确定 的 ， 首 先 传递 给 该 水 数 的 参数 以 某 个 确定 的 顺序 被 讨 入 栈 ， 然 
后 它 的 返回 值 也 以 确定 的 方式 被 传 回 给 调用 者 。 同 样 ， 这 就 是 虚拟 机 
实现 本 地 方法 栈 的 方式 ， 很 可 能 本 地 方法 接口 需要 回调 Java 虚 拟 机 中 的 
Java 方 法 (这 也 是 由 设计 者 决定 的 ) ， 在 这 种 情形 下 ， 该 线程 会 保存 本 
地 方法 栈 的 状态 并 进入 到 另 一 个 Java 栈 。 就 像 其 他 运行 时 内 存 区 一 样 ， 
本 地 方法 栈 占用 的 内 存 区 也 不 需要 是 固定 大 小 的 ， 它 可 以 根据 需要 动 
人 态 扩 展 或 者 收缩 ， 某 些 JVM 也 允许 用 户 或 者 程序 员 指 定 该 内 存 区 的 初 
始 大 小 以 及 最 大 、 最 小 值 。 

注意 ， 在 SUN 的 HOT SPOT 虚 拟 机 中 ， 不 区 分 本 地 方法 栈 和 虚拟 机 
栈 。 因 此 ， 和 虚拟 机 栈 一 样 ， 它 也 会 抛 出 StackOverFlowError 和 
OutOfMemoryErroro 

2.1.1.4 Javal 


堆 在 JVM 规 范 里 是 一 种 通用 性 的 内 存 池 (也 存在 于 RAM 中 ) , RH 
于 存放 所 有 的 Java 对 象 。 扒 是 一 个 运行 时 数据 区 ， 类 的 对 象 从 中 分 配 空 
间 。 这 些 对 象 通过 New 关 键 字 被 建立 ， 它 们 不 需要 程序 代码 来 显 式 地 
释放 。 堆 是 由 垃圾 回收 来 负责 的 ， 堆 的 优势 是 可 以 动态 地 分 配 内 存 大 
小 ， 生 存 周期 也 不 需要 事先 告诉 编译 器 。 由 于 它 是 在 运行 时 动态 分 配 
内 存 的 ，Java 的 垃圾 收集 器 会 自动 收 走 那 些 不 再 使 用 的 数据 。 但 缺点 
是 ， 由 于 要 在 运行 时 动态 分 配 内 存 ， 所 以 数据 存 取 速 度 较 慢 。 大 多 数 
的 虚拟 机 里 ，Java 中 的 对 象 和 数组 都 存放 在 堆 中 。 


堆 不 同 于 栈 的 好 处 是 ， 编 译 器 不 需要 知道 要 从 堆 里 分 配 多 少 存 储 
区 域 ， 也 不 必 知 道 存 储 的 数据 在 堆 里 需要 存活 多 长 时 间 。 因 此 ， 在 堆 
里 分 配 存储 相 较 于 栈 来 说 ， 有 很 大 的 灵活 性 。 当 你 需要 创建 一 个 对 象 
的 时 候 ， 只 需要 引用 New 关 键 字 写 一 行 简 单 的 代码 ， 当 执行 这 行 代码 
时 ， 会 自动 在 堆 里 进行 存储 分 配 。 当 然 ， 为 这 种 灵活 性 必须 要 付出 相 
应 的 代价 ， 即 用 堆 进 行 存储 分 配 比 用 堆栈 进行 存储 存储 需要 更 多 的 时 
间 。 

Java 扒 区 在 JVM 局 动 的 时 候 即 被 创建 ， 它 只 要 求 逻 辑 上 是 连续 的 ， 
在 物理 空间 上 可 以 是 不 连续 。 所 有 的 线程 共享 Java 堆 ， 在 这 里 可 以 划分 
线程 私有 的 缓冲 区 (Thread Local Allocation Buffer，TLAB) 。 

如 前 所 述 ，Java 扒 区 是 一 块 用 于 存储 对 象 实 例 的 内 存 区 ， 同 时 也 是 
GC (Garbage Collection ， 垃 圾 收集 器 ) 执行 垃圾 回收 的 重点 区 域 。 正 
是 因为 Java 堆 区 是 GC 的 重点 回收 区 域 ， 那 么 GC 极 有 可 能 会 在 大 内 存 的 
使 用 和 频繁 进行 垃圾 回收 过 程 上 成 为 系统 性 能 瓶颈 。 为 了 解决 这 个 间 
题 ，JVM 的 设计 者 们 开始 考虑 是 否 一 定 需要 将 对 象 实例 存储 到 Java 推 区 
内 。 基 于 OpenJDK[7] 深 度 定制 的 TaobaoJVM[8]， 其 中 创新 的 GCIH 

(GC invisible heap) 技术 实现 了 off-heap， 即 将 生命 周期 较 长 的 Java 对 
象 从 heap 中 移 到 heap 之 外 ， 并 且 GC 不 能 管理 GCIH 内 部 的 Java 对 象 ， 以 
此 达到 降低 GC 的 回收 频率 和 提升 GC 的 回收 效率 的 目的 。 除 此 之 外 ， 逃 
逸 分 析 与 栈 上 分 配 这 样 的 优化 技术 同样 也 是 降低 GC 回收 频率 和 提升 GC 
回收 效率 的 有 效 方式 。 这 样 一 来 ，Java 堆 区 就 不 再 是 Java 对 象 内 存 分 配 
的 唯一 选择 了 。 目 前 主流 的 垃圾 收集 算法 是 按 代 收 集 ， 即 按照 对 象 的 
生存 时 间 分 为 新 生 代 和 老年 代 。 新 生 代 又 进一步 被 划分 为 Eden 区 、 
From Survivor 区 和 To Survivor 区 ， 主 要 是 为 了 垃圾 回收 用 途 。 这 里 浅显 
地 提 一 些 垃圾 回收 知识 ， 详 细 内 容 请 参考 第 7 章 。 

逃逸 分 析 英 文 全 名 是 Escape Analysis。 在 计算 机 语言 编译 器 优化 原 
理 中 ， 迷 移 分 析 是 指 分 析 指 针 动 态 范围 的 方法 ， 它 同 编译 器 优化 原理 
的 指针 分 析 和 外 形 分 析 相 关联 。 计 算 机 软件 方面 ， 逃 逸 分析 指 的 是 计 
算 机 语言 编译 器 语言 优化 管理 中 ， 分析 指 针 动 态 范围 的 方法 。 通 俗 点 
讲 ， 如 果 一 个 对 象 的 指针 被 多 个 方法 或 线程 引用 时 ， 那 我 们 可 以 称 这 
个 指针 发 生 了 逃逸 。Java 语言 也 有 逃逸 情况 存在 ， 示 例 代 码 如 代码 清 
单 2-6 所 示 。 


代码 清单 2-6 ”逃逸 分 析 示 例 代 码 escapeAnalysisClass 
public class escapeAnalysisClass{ 
public static B b; 


public void globalVariablePointerEscape () {// ŻA AREMA, AER 
b-new B(); 


public B methodPointerEscape () {// J iki&wMA, Ai 


return new B(); 


public void instancePassPointerEscape() { 
methodPointerEscape ().printClassName (this); // RAN ARAM 


class B{ 
public void printClassName(G g) { 
System.out.println(g.getClass().getName()); 


) 
public class G ( 
public static B b; 
public void globalVariablePointerEscape () {// 给 全 局 变量 赋值 ， 发 生 逃 饮 
b-new B(); 
) 
public B methodPointerEscape ()(//Z iki&wMA, Aui 
return new B(); 
) 
public void instancePassPointerEscape() { 
methodPointerEscape ().printClassName (this) ;// X455] ARBRE 


} 
class BA 
public void printClassName(G g) { 
System.out.println(g.getClass().getName()); 


代码 清单 2-6 所 示 的 这 个 例子 中 ， 一 共 举 了 3 种 常见 的 指针 逃逸 场 
景 ， 分 别 是 全 局 变量 赋值 、 方 法 返回 值 、 实 例 引 用 传递 。 

逃逸 分 析 研 究 对 于 Java 编 译 器 有 什么 好 处 ?我 们 知道 Java 对 象 总 是 
在 堆 中 被 分 配 的 ， 因 此 Java 对 象 的 创建 和 回收 对 系统 的 开销 是 很 大 的 。 
Java 语 言 被 批评 的 一 个 地 方 ， 也 是 认为 Java 性 能 慢 的 一 个 原因 就 是 Java 
不 支持 运行 时 栈 分 配对 象 ， 缺 少 像 C# 里 面 的 值 对 象 或 者 C++ 里 面 的 
struct 结 构 。JDK6 里 的 Swing 内 存 和 性 能 消耗 的 瓶颈 就 是 由 于 发 生 逃 逸 
所 造成 的 。 栈 里 面 只 保存 了 对 象 的 指针 ， 当 对 象 不 再 被 使 用 后 ， 需 要 
依靠 GC 来 遍历 引用 树 并 回收 内 存 ， 如 果 对 象 数 量 较 多 ， 将 给 GC 囊 来 较 
大 压力 ， 也 间接 影响 了 应 用 的 性 能 。 减 少 临 时 对 象 在 堆 内 分 配 的 数 
量 ， 无 疑 是 最 有 效 的 优化 方法 。 

在 Java 应 用 里 普遍 存在 一 种 场景 ， 一 般 是 在 方法 体内 ， 声 明了 一 个 
局 部 变量 ， 且 该 变量 在 方法 执行 生命 周期 内 未 发 生 逃 逸 ， 因 为 在 方法 
体内 未 将 引用 暴露 给 外 面 。 按 照 JVM 内 存 分 配 机 制 ， 首 先 会 在 堆 里 创 
建 变 量 类 的 实例 ， 然 后 将 返回 的 对 象 指 针 压 入 调用 栈 ， 继 续 执 行 。 这 
是 JVM 优 化 前 的 方式 。 

我 们 可 以 采用 逃逸 分 析 原 理 对 JVM 进 行 优化 ， 即 针对 栈 的 重新 分 
配方 式 。 首 先 我 们 需要 分 析 并 且 找 到 未 逃逸 的 变量 ， 将 变量 类 的 实例 
化 内 存 直接 在 栈 里 分 配 (无 须 进入 堆 ) ,分配 完成 后 ， 继 续 在 调用 材 
内 执行 ， 最 后 线程 结束 ， 栈 空间 被 回收 ， 局 部 变量 对 象 也 被 回收 。 通 
过 这 种 优化 方式 ,与 优化 前 的 方案 主要 区 别 在 栈 空间 直接 作为 临时 对 
象 的 存储 介质 ， 从 而 减少 了 临时 对 象 在 堆 内 的 分 配 数 量 。 

基于 逃逸 分 析 的 JVM 优 化 原理 很 简单 ， 但 是 在 应 用 过 程 中 还 是 有 
诸多 因素 需要 被 考虑 。 比 如 ， 由 于 与 JAVA 的 动态 性 有 冲突 ， 所 以 逃逸 
分 析 不 能 在 静态 编译 时 进行 ， 必 须 在 JIT[9] 里 完成 。 因 为 你 可 以 在 运行 
时 通过 动态 代理 改变 一 个 类 的 行为 ， 此 时 ， 逃 逸 分 析 是 无 法 得 知 类 已 
经 变化 了 。 

那么 JIT 和 后 么 通过 逃逸 分 析 进 行 代码 优化 呢 ? 分 析 清 单 2-7 所 示 代 
码 。 


代码 清单 2-7 逃逸 分 析 优化 示例 代码 my method 
public void my method()| 
V v-new V(); 
//use v 


在 这 个 方法 中 创建 的 局 部 对 象 被 赋 给 了 v， 但 是 没有 返回 ， 没 有 赋 
给 全 局 变量 等 操作 ， 因 此 这 个 对 象 是 没有 逃逸 的 ， 是 可 以 在 运行 时 栈 
进行 分 配 和 销毁 的 对 象 。 没 有 发 生 逃 逸 的 对 象 由 于 生命 周期 都 在 一 个 
方法 体内 ， 因 此 它们 是 可 以 在 运行 时 栈 上 分 配 并 销毁 。 

这 样 在 JIT 编 译 Java 伪 代码 时 ， 如 果 能 分 析出 这 种 代码 ， 那 么 非 逃 
逸 对 象 其 创建 和 回收 就 可 以 在 栈 上 进行 ， 从 而 能 大 大 提高 Java 的 运行 性 
能 。 

另外 ， 为 什么 要 在 逃逸 分 析 之 前 进行 内 联 分 析 呢 ? 这 是 因为 往往 
有 些 对 象 在 被 调用 过 程 中 创建 并 返回 给 调用 过 程 ， 调 用 过 程 使 用 完 该 
对 象 就 被 销毁 了 。 这 种 情况 下 如 果 将 这 些 方 法 进行 内 联 ， 它 们 就 由 两 
个 方法 体 变 成 一 个 方法 体 了 ， 这 种 原来 通过 返回 传递 的 对 象 就 变 成 了 
万 法 内 的 局 部 对 象 ， 就 变 成 了 非 逃 逸 对 象 了 ， 这 样 这 些 对 象 就 可 以 在 
同一 栈 上 进行 分 配 了 。 

Java7 开 始 支 持 对 象 的 栈 分 配 和 逃逸 分 析 机 制 。 这 样 的 机 制 除 能 将 
堆 分 配对 象 变 成 栈 分 配对 象 ， 逃 逸 分 析 还 有 其 他 两 个 优化 应 用 。 

e 同步 消除 。 我 们 知道 线程 同步 的 代价 是 相当 高 的 ， 同 步 的 后 果 是 
降低 并 发 性 和 性 能 。 逃 逸 分 析 可 以 判断 出 某 个 对 象 是 否 始终 只 被 一 个 
线程 访问 ， 如 果 只 被 一 个 线程 访问 ， 那 么 对 该 对 象 的 同步 操作 就 可 以 
转化 成 没有 同步 保护 的 操作 ， 这 样 就 能 大 大 提高 并 发 程度 和 性 能 。 

m 矢量 替代 。 逃 锡 分 析 方 法 如 果 发 现 对 象 的 内 存 存储 结构 不 需要 连 
续 进 行 的 话 ， 就 可 以 将 对 象 的 部 分 甚至 全 部 都 保存 在 CPU 寄存 器 内 ， 
这 样 能 大 大 提高 访问 速度 。 

Java7 完 全 支持 栈 式 分 配对 象 ，JIIT 支 持 逃 锡 分 析 优 化 ， 此 外 Java7 
还 默认 支持 OpenGEL 的 加 速 功能 。 


堆 内 垃圾 回收 


几乎 所 有 的 对 象 和 数组 都 是 在 堆 中 分 配 空间 的 。Java 扒 由 年 轻 代 和 
年 老 代 两 个 部 分 组 成 ， 年 轻 代 用 于 存放 刚刚 产生 的 对 象 和 年 轻 的 对 
象 ， 如 果 对 象 一 直 没 有 被 回收 ， 生 存 得 足够 长 ， 来 年 对 象 就 被 被 移入 
年 老 代 。 年 轻 代 又 可 进一步 细 分 为 eden、 survivor space0 和 survivor 
spacel。eden 即 对 象 的 出 生地 ， 大 部 分 对 象 刚刚 建立 时 都 会 被 存放 在 这 
里 。Survivor 空 间 是 存放 其 中 的 对 象 至 少 经 历 了 一 次 垃圾 回收 ， 并 得 以 
广 存 下 来 的 。 如 果 在 和 幸存 区 的 对 象 到 了 指定 年 龄 仍 未 被 回收 ， 则 有 机 
会 进入 年 老 代 (Tenured) 。 


对 象 在 内 存 中 的 分 配方 式 实例 代 码 如 代码 清单 2-8 所 示 。 


代码 清单 2-8 堆 分 配 示例 TestHeapGC 
public class TestHeapGC { 
public static void main(String[] args) { 
byte[] bl = new byte[1024*1024/2]; 
byte[] b2 = new byte[1024*1024*8]; 
b2 = null; 
b2 = new byte[1024*1024*8] ;// 进 行 一 次 年 轻 代 GC 
System.gc() ; 


} 


我 们 针对 本 例 使 用 JVM 人 参数 运行 程序 ， 读 者 可 以 在 Eclipse 这 样 的 
GUI 工具 里 面 设置 ， 也 可 以 在 命令 行 里 面 配置 ， 具 体 参 数 如 清单 2-9 所 
示 ， 我 们 设置 了 60MB 的 内 存 空间 作为 堆 空间 。 


代码 清单 2.9 JVM 参数 
-XX:+PrintGCDetails -XX:SurvivorRatio=8  -XX:MaxTenuringThreshold-15 -Xms40M 
-Xmx40M -Xmn20M 


清单 2-8 的 代码 采用 2-9 的 配置 后 运行 ，GC 输 出 如 清单 2-10 所 示 。 


代码 清单 2-10 2-8 代码 运行 后 GC 输出 
[GC [DefNew: 9031K->661K (18432K), 0.0022784 secs] 9031K->661K(38912K), 0.0023178 
secs] [Times: user-0.02 sys-0.00, real-0.02 secs] 
Heap 
def new generation total 18432K, used 9508K [0x34810000, 0x35c10000, 0x35c10000) 
eden space 16384K, 54% used [0x34810000, 0x350b3e58, 0x35810000) 
from space 2048K, 32$ used [0x35a10000, 0x35ab5490, 0x35c10000) 
to space 2048K, 0% used [0x35810000, 0x35810000, 0x35a10000) 
tenured generation total 20480K, used 0K [0x35c10000, 0x37010000, 0x37010000) 
the space 20480K, 0$ used [0x35c10000, 0x35c10000, 0x35c10200, 0x37010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706db10, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


从 GC 输 出 可 以 看 出 ， 在 进行 多 次 内 存 分 配 的 过 程 中 ， 触 发 了 一 次 
年 轻 代 GC。 在 这 次 GC 中 ， 原 本 分 配 在 eden 段 的 变量 b1 被 移动 到 from 空 
间 段 (s0) 。 具 体 如何 读 GC 输出 ， 我 们 会 在 第 7 章 进 一 步 解 释 。 

我 们 调整 策略 ， 分 配 的 8MB 内 存 被 分 配 在 eden 年 轻 代 。 再 一 次 运 
行程 序 ，GC 输 出 如 清单 2-11 所 示 。 


代码 清单 2-11 2-8 代码 运行 后 GC 输出 
[GC [DefNew: 9031K->661K (18432K), 0.0023186 secs] 9031K->661K(38912K), 0.0023597 
secs] [Times: user-0.02 sys-0.00, real-0.02 secs] 
[Full GC (System) [Tenured: 0K->8853K (20480K) , 0.0179368 secs] 9180K->8853K (38912K) , 
[Perm : 374K-5374K (12288K) ], 0.0179893 secs] [Times: user=0.00 sys=0.02, real=0.02 secs] 
Heap 
def new generation total 18432K, used 327K [0x34810000, 0x35c10000, 0x35c10000) 
eden space 16384K, $ used [0x34810000, 0x34861£28, 0x35810000) 
from space 2048K, 0% used [0x35a10000, 0x35a10000, 0x35c10000) 
to space 2048K, 0% used [0x35810000, 0x35810000, 0x35a10000) 
tenuredgeneration total 20480K, used 8853K [0x35c10000, 0x37010000, 0x37010000) 
the space 20480K, 43% used [0x35c10000, 0x364b5458, 0x364b5600, 0x37010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706db40, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


清单 2-11 的 输出 显示 ， 在 Full GC 之 后 ， 年 轻 代 空间 被 清空 KH 
回收 的 对 象 全 部 被 移入 年 老 代 。 

2.1.1.5 方法 区 

方法 区 主要 保存 的 信息 是 类 的 元 数据 。 方 法 区 与 堆 空间 类 似 ， 它 
也 是 被 JVM 中 所 有 的 线程 共享 的 区 域 。 如 图 2-3 方 法 区 组 成 部 分 图 所 
m, 方法 区 中 最 为 重要 的 是 类 的 类 型 信息 、 常 量 闻 、 域 信息 、 方 法 信 
息 。 类 型 信息 包括 类 的 完整 名 称 、 父 类 的 完整 名 称 、 类 型 修饰 符 
(Public, Protected, Private) 和 类 型 的 直接 接口 类 表 。 

常量 闻 包 括 类 方法 、 域 等 信息 所 引用 的 常量 信息 。 域 信息 包括 域 
名 称 、 域 类 型 和 域 修饰 符 。 方 法 信息 包括 方法 名 称 、 返 回 类 型 、 方 法 
人 参数、 方法 修饰 符 、 方 法 字 节 人 码 、 操 作 数 栈 和 方法 栈 帧 的 局 部 变量 区 
大 小 以 及 异常 表 。 方 法 区 是 线程 间 共 享 的 ， 当 两 个 线程 同时 需要 加 载 
一 个 类 型 时 ， 只 有 一 个 类 会 请 求 ClassLoader[10] 加 载 ， 另 一 个 线程 则 
会 等 待 。 总 而 言 之 ， 方 法 区 内 保存 的 信息 大 部 分 来 自 于 Class 文 件 ， 是 
Java 应 用 程序 运行 必 不 可 少 的 重要 数据 。 


类 型 修饰 符 
(public/protected/ 
private). 

类 型 的 直接 接口 


图 2-3 方法 区 组 成 部 分 图 

在 HotSpot[11] 虚 拟 机 中 ， 方法 区 也 被 称 为 永久 区 ， 是 一 块 独立 于 
Java 堆 的 内 存 空 间 。 虽 然 被 叫 作 永久 区 ， 但 是 在 永久 区 中 的 对 象 同样 也 
是 可 以 被 GC 回 收 的 ， 只 是 对 于 GC 的 对 应 策略 与 Java 扒 空间 略 有 不 同 。 

GC 针对 永久 区 的 回收 ， 通 常 主要 从 两 个 方面 分 析 ， 一 是 GC 对 永久 
区 常量 池 的 回收 ， 二 是 永久 区 对 类 元 数据 的 回收 。 

HotSpot 虚 拟 机 对 常量 池 的 回收 策略 是 很 明确 的 ， 只 要 常量 池 中 的 
常量 没有 被 任何 地 方 引 用 ， 就 可 以 被 回收 。 

清单 2-12 所 示人 代码 生 成 大 量 String 对 象 ， 并 将 其 加 入 常量 池 中 。 
String.inten () 方法 的 含义 是 如 果 常 量 池 中 已 经 存在 当前 String， 则 返 
回 池 中 的 对 象 ， 如 果 常 量 池 中 不 存在 当前 String 对 象 ， 则 先 将 String 加 
入 常量 地 ， 并 返回 池 中 的 对 象 引 用 。 因 此 ， 不 停 地 将 String 对 象 加 入 常 
量 闻 会 导致 永久 区 饱和 ， 如 果 GC 不 能 回收 永久 区 的 这 些 常量 数据 ， 那 
么 就 会 抛 出 OutofMemoryError 错 误 。 


代码 清单 2-12 回收 永久 区 示例 permGenGC 
public class permGenGC { 
public static void main(String[] args) { 
for(int i=0;i<Integer.MAX VALUE; i**)| 
String t - String.valueOf (i).intern(); // hA E EM 


} 


同样 的 ，JVM 设 置 如 清单 2-13 所 示 。 


代码 清单 2.13 JVM 设置 


-XX:PermSize-2M -XX:MaxPermSize-4M -XX:+PrintGCDetails 


运行 2-12 程 序 后 ，GC 输 出 如 清单 2-14 所 示 。 


代码 清单 2.14 GC 输出 
[Full GC [Tenured: 0K->149K (10944K), 0.0177107 secs] 3990K->149K (15872K), [Perm : 
4096K-»374K(4096K)], 0.0181540 secs] [Times: user=0.02 sys=0.02, real=0.03 secs] 
[Full GC [Tenured: 149K->149K (10944K) , 0.0165517 secs] 3994K->149K (15936K), [Perm : 
4096K-»374K(4096K)], 0.0169260 secs] [Times: user=0.01 sys=0.00, real=0.02 secs] 
[Full GC [Tenured: 149K->149K (10944K) , 0.0166528 secs] 3876K->149K (15936K), [Perm : 
4096K-»374K(4096K)], 0.0170333 secs] [Times: user=0.02 sys-0.00, real-0. 


从 上 面 2-14 的 输出 可 以 看 出 ， 每 当 常 量 池 饱和 时 FULL GC 总 能 顺 
利 回收 常量 池 数 据 ， 确 保 程序 稳定 持续 进行 。 

2.1.1.6 缓存 

编写 高 效 的 程序 并 不 只 在 于 算法 的 精巧 ， 还 应 该 考虑 到 计算 机 内 
部 的 组 织 结 构 、CPU 微 指令 的 执行 、 缓 存 的 组 织 和 工作 原理 等 。 如 果 
完全 没有 考虑 缓存 、 微 指令 实现 ， 作 者 认为 ， 即 使 好 的 算法 在 实际 中 


不 见得 有 高 效率 。 
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缓存 的 主要 作用 是 暂时 保存 数据 处 理 结 果 ， 并 提供 下 次 访问 时 使 
用 。 在 很 多 场合 ， 数 据 的 处 理 、 获 取 这 类 操作 可 能 会 耗费 大 量 时 间 ， 
当 对 数据 的 请 求 量 很 大 时 ， 频 繁 的 数据 处 理会 耗 尽 CPU 资源 。 当 有 其 
他 线程 或 者 客户 端 需要 查询 相同 的 数据 资源 时 ， 缓 存 可 以 帮助 我 们 省 
Mdb < 数据 的 处 理 流程 ， 直 接 从 缓存 中 获取 处 理 结 果 ， 并 立即 返回 

请 求 组 件 ， 以 此 提高 系统 的 响应 时 间 。 我 们 这 里 所 指 的 缓存 涵盖 
eis 内 存 、 磁 盘 


早期 的 CPU 存储 层次 只 有 三 层 ， 即 CPU 的 寄存 器 、DRAM 主 存 和 
磁盘 存储 。 因 为 寄存 器 和 主 存 之 间 的 访问 时 间 开销 差距 很 大 ， 于 是 设 
计 者 在 寄存 器 (一 个 时 钟 周期 ) 和 主 存 之 间 加 入 了 L1 缓 存 (2 一 4 个 时 
钟 周期 ) ， 后 来 由 于 L1 缓 存 和 主 存 之 间 的 差距 ， 又 在 主 存 和 L1 之 间 加 
入 了 L2 缓 存 ， 当 然后 面 还 有 L3 缓 存 。 

图 2-4 高 速 缓存 总 线 结构 图 所 示 是 高 速 缓存 存储 器 的 典型 总 线 结 
构 。 
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图 2-4 高 速 缓存 总 线 结构 
图 2-5 通 用 缓存 的 组 织 结构 图 清晰 地 说 明了 通用 缓存 的 组 织 结构 。 
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图 2-5 通用 缓存 的 组 织 结构 

可 以 看 到 ， 缓 存 内 部 是 以 组 的 形式 存在 和 组 织 的 。 图 中 的 每 一 块 
代表 一 组 ， 每 组 由 一 到 多 行 组 成 《当然 图 中 的 是 每 组 有 多 行 ) 。 

计算 机 CPU 和 内 存 的 交互 是 最 频繁 的 ， 内 存 是 我 们 的 高 速 缓存 
区 ， 最 开始 用 户 直接 使 用 磁盘 和 CPU 进行 交互 ， 随 着 CPU 运转 速度 越 
来 越 快 ， 磁 盘 渐渐 地 跟 不 上 CPU 的 读 写 速 度 ， 最 后 发 展 到 远 远 跟 不 上 
的 地 步 ， 导 致 很 严重 的 MO 等 待 成 本 ， 进 一 步 导 致 CPU 的 等 待 成 本 。 这 
时 我 们 设计 出 了 内 存 ， 用 内 存 来 缓存 CPU 计算 出 来 的 数据 ， 这 一 招 刚 
开始 也 很 不 错 ， 但 是 随 着 CPU 的 不 断 发 展 ， 内 存 的 读 写 速度 也 远 远 跟 


不 上 CPU 的 读 写 速度 ， 更 不 用 说 GPU 的 运算 速度 了 。 因 此 ， 为 了 解决 
x— 229, CPU BESMCPULMAT SRE, ARAKI 
状 。 

我 们 知道 单 核 CPU 的 主 频 不 可 能 无 限制 的 增长 ， 要 想 较 大 地 提升 
性 能 ， 我 们 需要 涉足 多 个 处 理 器 协同 工作 。 基 于 高 速 缓存 的 存储 交互 
方式 很 好 地 解决 了 处 理 器 与 内 存 之 间 的 矛盾 ， 但 也 引入 了 新 的 问题 ， 
即 缓存 一 致 性 问题 。 在 多 处 理 器 系统 中 ， 每 个 处 理 器 有 自己 的 高 速 缓 
存 ， 而 他 们 又 共享 同一 块 内 存 ， 当 多 个 处 理 器 运算 都 涉及 同一 块 内 存 
区 域 的 时 候 ， 就 有 可 能 发 生 缓 存 不 一 致 的 现象 。 为 了 解决 这 一 问题 ， 
需要 各 个 处 理 器 运行 时 都 遵循 一 些 协议 ， 在 运行 时 需要 将 这 些 协 议 保 
证 数据 的 一 致 性 。 这 类 协议 包括 MSI、MESI、 MOSI, Synapse, 
Firely、DragonProtocol 等 。 

Java 中 也 有 很 多 地 方 用 到 了 缓存 ， 首 当 其 冲 的 就 是 持久 层 缓存 。 

要 实现 Java 缓 存 有 很 多 种 方式 ， 最 简单 的 无 非 就 是 static 
HashMap， 它 是 基于 内 存 的 缓存 ， 一 个 Map 可 以 被 用 来 存储 引用 对 象 的 
缓存 。 为 了 区 分 缓存 的 数据 ， 我 们 首先 要 解决 的 问题 是 对 象 的 有 效 性 
以 及 生命 周期 。 如 果 这 个 问题 没有 很 好 地 解决 ， 很 容易 就 导致 内 存 急 
剧 上 升 。 对 象 生 命 周 期 控制 可 以 采用 声明 SoftReference 、 
WeakReference、 PhantomReference 这 三 种 对 象 类 型 来 实现 ， 有 别 于 强 
引用 对 象 ， 这 三 种 偏 弱 引 用 类 型 的 对 象 的 生命 周期 与 JVM 挂 钩 ，JVM 
内 存 不 足 了 就 会 立即 被 回收 ， 这 样 能 很 好 地 控制 OutOfMemoryError 异 
常 。 关 于 对 象 引 用 话题 的 详细 内 容 我 们 会 在 第 3 章 深入 讨论 。 

前 面 已 经 解释 过 ， 为 什么 要 缓存 ， 无 非 就 是 节省 访问 时 间 ， 以 及 
大 并 发 量 带 来 的 访问 上 资源 的 消耗 。 这 个 资源 包括 软 资 源 和 硬 资 源 ， 
对 象 闻 应 该 是 Java 程 序 员 最 常见 的 缓存 机 制 。 对 象 闻 化 ， 是 目前 很 常用 
的 一 种 系统 优化 技术 。 它 的 核心 思想 是 ， 如 果 一 个 类 被 频繁 请 求 使 
用 ， 那 么 不 必 每 次 都 生成 一 个 实例 ， 可 以 将 这 个 类 的 一 些 实例 保存 在 
一 个 “ 池 ” 中 ， 待 需要 使 用 的 时 候 直接 从 池 中 获取 。 这 个 “ 池 ” 就 称 为 对 象 
闻 。 在 实现 细节 上 ， 它 可 能 是 一 个 数组 ， 一 个 链表 或 者 任何 集合 类 。 
对 象 闻 的 使 用 非常 广泛 ， 例 如 线程 并 和 数据 库 连 接 闻 。 线 程 闻 中 保存 
着 可 以 被 重用 的 线程 对 象 ， 当 有 任务 被 提交 到 线程 时 ， 系 统 并 不 需要 
新 建 线 程 ， 而 是 从 闻 中 获得 一 个 可 用 的 线程 ， 执 行 这 个 任务 。 在 任务 


结束 后 ， 不 需要 关闭 线程 ， 而 将 它 返 回 到 池 中 ， 以 便 下 次 继续 使 用 。 
由 于 线程 的 创建 和 销毁 是 较为 费时 的 工作 ， 因 此 ， 在 线程 频繁 调度 的 
系统 中 ， 线 程 池 可 以 很 好 地 改善 性 能 。 数 据 库 连接 池 也 是 一 种 特殊 的 
对 象 闻 ， 它 用 于 维护 数据 库 连 接 的 集合 。 当 系统 需要 访问 数据 库 时 ， 
不 需要 重新 建立 数据 库 连 接 ， 而 可 以 直接 从 池 中 获取 ; 在 数据 库 操作 
完成 后 ， 也 不 关闭 数据 库 连 接 ， 而 是 将 连接 返回 到 连接 池 中 。 由 于 数 
据 库 连接 的 创建 和 销毁 是 重量 级 的 操作 ， 因 此 ， 避 人 免 频繁 进行 这 两 个 
操作 对 改善 系统 的 性 能 也 有 积极 意义 。 目 前 应 用 较为 广泛 的 数据 库 连 
接 闻 组 件 有 C3P0 和 Proxool。 

从 实际 项 目 来 看 ， 缓 存 用 得 好 能 提高 性 能 ， 反 之 会 急剧 的 降低 产 
品 的 性 能 。 以 Hibernate 为 例 ， 理 论 上 来 说 ，Hibernate 性 能 不 如 JDBC， 
但 是 如 果 使 用 缓存 机 制 较 好 的 话 ， 能 更 好 也 未 党 不 能 。Hibernate 缓 存 
最 核心 的 部 分 是 对 象 的 有 效 性 ， 缓 存 的 命中 率 越 高 意味 着 性 能 越 高 ， 
命中 率 跟 缓 存 对 象 的 有 效 性 息息相关 ， 如 果 缓 存 中 对 象 有 效 性 很 差 ， 
其 性 能 甚至 会 低 于 不 用 缓存 ， 因 为 缓存 本 身 就 会 消耗 性 能 和 计算 资 
源 ， 缓 存 的 对 象 如 果 很 多 很 快 就 失效 ， 那 效果 无 疑 得 不 偿 失 。 缓 存 的 
深度 也 有 讲究 ， 以 J2EE 项 目 来 说 ， 这 个 深度 是 指 从 页 面 到 数据 库 的 层 
次 结构 ， 显 然 页 面 缓存 的 性 能 最 好 ， 因 为 调用 页 面 缓存 消耗 的 资产 最 
少 ， 当 然 现实 中 是 不 可 能 有 太 多 页 面 缓存 的 。 

在 开发 中 大 型 Java 软 件 项 目 时 ， 很 多 Java 架 构 师 都 会 遇 到 数据 库 读 
写 瓶 颈 ， 如 果 你 在 系统 架构 时 并 没有 将 缓存 策略 考虑 进去 ， 或 者 并 没 
有 选择 更 优 的 缓存 策略 ， 那 么 到 时 候 重 构 起 来 将 会 是 一 个 于 梦 。 目 前 
主流 的 5 个 常用 的 Java 分 布 式 缓存 框架 ， 这 些 缓存 框架 支持 多 人 台 服 务 器 
的 缓存 读 写 功能 ， 可 以 让 你 的 缓存 系统 更 容易 扩展 。 

m Ehcache 一 Java 分 布 式 级 存 框架 

Ehcache 是 一 个 Java 实 现 的 开源 分 布 式 缓存 框架 ，Ehcache 可 以 有 效 
地 减轻 数据 库 的 负载 ， 可 以 让 数据 保存 在 不 同 服务 器 的 内 存 中 ， 在 需 
要 数据 的 时 候 可 以 快速 存 取 。 同 时 EhCache 扩展 非常 简单 ， 官 方 提供 的 
Cache 配 置 方式 有 好 几 种 。 你 可 以 通过 声明 配置 、 在 xml 中 配置 、 在 程 
序 里 配置 或 者 调用 构造 方法 时 传 入 不 同 的 参数 。 

m Cacheonix- 一 高 性 能 Java 分 布 式 缓存 系统 


Cacheonix 同 样 也 是 一 个 基于 Java 的 分 布 式 集群 缓存 系统 ， 它 同样 
可 以 帮助 你 实现 分 布 式 缓存 的 部 署 。 

和 ASimpleCache 一 轻 量 级 Android 缓 存 框架 

ASimpleCache 是 一 款 基 于 Android 的 轻 量 级 缓存 框架 ， 它 只 有 一 个 
Java 文 件 ，ASimpleCache 基 本 可 以 缓存 常用 的 Android 对 象 ， 包 括 普通 
字符 串 、JSON 对 象 、 经 过 序列 化 的 Java 对 象 、 字 节 数 组 等 。 

m JBoss Cache 一 基于 事物 的 Java 缓 存 框 架 

JBoss Cache 是 一 款 基 于 Java 的 事务 处 理 缓存 系统 ， 它 的 目标 是 构建 
一 个 以 Java 框 架 为 基础 的 集群 解决 方案 ， 可 以 是 服务 器 应 用 ， 也 可 以 是 
Java SE 应 用 。 

m Voldemort 一 基于 键 - 值 (key-value) 的 缓存 框架 

Voldemort 是 一 款 基 于 Java 开 发 的 分 布 式 键 - 值 缓存 系统 ， 像 JBoss 
Cache 一 样 ，Voldemort 同 样 支持 多 台 服 务 器 之 间 的 缓存 同步 ， 以 增强 系 
统 的 可 靠 性 和 读 取 性 能 。 

前 面 说 的 都 是 内 存 缓存 ， 现 在 来 聊 聊 硬件 缓存 。 

硬盘 缓存 (Cache memory) 是 人 硬盘 控制 器 上 的 一 块 内 存心 片 ， 具 
有 极 快 的 存 取 速度 ， 它 是 硬盘 内 部 存储 和 外 界 接口 之 间 的 缓冲 器 。 由 
于 硬盘 的 内 部 数据 传输 速度 和 外 界 介 面 传输 速度 不 同 ， 缓 存在 其 中 起 
到 一 个 缓冲 的 作用 。 缓 存 的 大 小 与 速度 是 直接 关系 到 硬盘 的 传输 速度 
的 重要 因素 ， 能 够 大 幅度 地 提高 硬盘 整体 性 能 。 当 硬盘 存 取 零 碎 数 气 
时 需要 不 断 地 在 硬盘 与 内 存 之 间 交 换 数 据 ， 如 果 有 大 缓存 ， 则 可 以 将 
那些 零碎 数据 暂 存 在 缓存 中 ， 减 小 外 系统 的 负 向 ， 也 提高 了 数据 的 传 
输 速 度 。 

硬盘 的 缓存 主要 起 三 种 作用 : 一 是 预 读 取 。 当 硬盘 受到 CPU 指 令 
控制 开始 读 取 数据 时 ， 硬 盘 上 的 控制 心 片 会 控制 磁头 把 正在 读 取 的 族 
的 下 一 个 或 者 几 个 簇 中 的 数据 读 到 缓存 中 (由 于 硬盘 上 数据 存储 时 是 
比较 连续 的 ， 所 以 读 取 命 中 率 较 高 ) ， 当 需要 读 取 下 一 个 或 者 几 个 簇 
中 的 数据 的 时 候 ， 硬 盘 则 不 需要 再 次 读 取 数据 ， 直 接 把 缓存 中 的 数据 
传输 到 内 存 中 就 可 以 了 ， 由 于 缓存 的 速度 远 远 高 于 磁头 读 写 的 速度 ， 
所 以 能 够 达到 明显 改善 性 能 的 目的 ， 二 是 对 写 入 动作 进行 缓存。 当 硬 
盘 接 到 写 入 数据 的 指令 之 后 ， 并 不 会 马上 将 数据 写 入 到 盘 片 上 ， 而 是 


先 暂时 存储 在 缓存 里 ， 然 后 发 送 一 个 “数据 已 写 入 ”的 信号 给 系统 ， 这 
时 系统 就 会 认为 数据 已 经 写 入 ， 并 继续 执行 下 面 的 工作 ， 而 硬盘 则 在 
空间 (不 进行 读 取 或 写 入 的 时 候 ) 时 再 将 缓存 中 的 数据 写 入 到 盘 片 
上 。 虽 然 对 于 写 入 数据 的 性 能 有 一 定 提升 ， 但 也 不 可 避免 地 带 来 了 安 
全 隐患 一 如 果 数 据 还 在 缓存 里 的 时 候 突然 掉 电 ， 那 么 这 些 数 据 就 会 丢 
失 。 对 于 这 个 问题 ， 硬 盘 厂 商 们 自然 也 有 解决 办 法 : 掉 电 时 ， 磁 头 会 
借助 惯性 将 缓存 中 的 数据 写 入 零 磁 道 以 外 的 暂 存 区 域 ， 等 到 下 次 启动 
时 再 将 这 些 数 据 写 入 目的 地 ; 第 三 个 作用 就 是 临时 存储 最 近 访 问 过 的 
数据 。 有 了 时候， 某 些 数据 是 会 经 常 需要 访问 的 ， 硬 盘 内 部 的 缓存 会 将 
读 取 比较 频繁 的 一 些 数据 存储 在 缓存 中 ， 再 次 读 取 时 就 可 以 直接 从 组 
存 中 直接 传输 。 

缓存 容量 的 大 小 不 同 品 牌 、 不 同型 号 的 产品 各 不 相同 ， 早 期 的 硬 
盘 缓存 基本 都 很 小 ， 只 有 几 百 KB ， 已 无 法 满足 用 户 的 需求 。2MB 和 
8MB 缓 存 是 现今 主流 硬盘 所 采用 ， 而 在 服务 器 或 特殊 应 用 领域 中 还 有 
缓存 容量 更 大 的 产品 ， 甚 至 达到 了 16MB、64MB 等 。 大 容量 的 缓存 虽 
然 可 以 在 硬盘 进行 读 写 工 作 状 态 下 ， 让 更 多 的 数据 存储 在 缓存 中 ， 以 
提高 硬盘 的 访问 速度 ， 但 并 不 意味 着 缓存 越 大 就 越 出 众 。 缓 存 的 应 用 
存在 一 个 算法 的 问题 ， 即 便 缓存 容量 很 大 ， 而 没有 一 个 高 效率 的 算 
法 ， 那 将 导致 应 用 中 缓存 数据 的 命中 率 偏 低 ， 无 法 有 效 发 挥 出 大 容量 
缓存 的 优势 。 算 法 是 和 缓存 容量 相辅相成 ， 大 容量 的 缓存 需要 更 为 有 
效率 的 算法 ， 否 则 性 能 会 大 打折 扣 ， 从 技术 角度 上 说 ， 高 容量 缓存 的 
算法 是 直接 影响 到 硬盘 性 能 发 挥 的 重要 因素 。 更 大 容量 缓存 是 未 来 硬 
盘 发 展 的 必然 趋势 。 总 的 来 说 ， 无 论 基 于 哪 种 介质 上 的 缓存 ， 缓 存 都 
是 把 双 刃 剑 ， 一 定 要 根据 缓存 的 特征 和 业务 场景 来 选择 使 用 才能 发 挥 
其 最 大 优势 。 

2.1.1.7 缓冲 区 

缓冲 区 是 一 块 特定 的 内 存 区 域 。 开 辟 缓 冲 区 的 目的 是 通过 缓解 应 
用 程序 上 下 层 之 间 的 性 能 差异 ， 提 高 系统 的 性 能 。 在 日 常生 活 中 ， 缓 
冲 的 一 个 典型 应 用 是 漏斗 ， 如 图 2-6 所 示 。 
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图 2-6 模拟 缓冲 区 

缓冲 可 以 协调 上 层 组 件 和 下 层 组 件 的 性 能 差 ， 当 上 层 组 件 性 能 优 
于 下 层 组 件 时 ， 可 以 有 效 减 少 上 层 组 件 对 下 层 组 件 的 等 待 时 间 。 基 于 
这 样 的 结构 ， 上 层 应 用 组 件 不 需要 等 待 下 层 组 件 真实 地 接受 全 部 数 
据 ， 即 可 返回 操作 ， 加 快 了 上 层 组 件 的 处 理 速度 ， 从 而 提升 系统 整体 
性 能 。 

JDK 里 的 BufferedWriter 就 是 一 个 缓冲 区 用 法 ， 一 般 来 说 ， 缓 冲 区 
不 宜 过 小 ， 过 小 的 缓冲 区 无 法 起 到 真正 的 缓冲 作用 ， 缓 冲 区 也 不 宜 过 
大 ， 过 大 的 缓冲 区 会 瀛 费 系统 内 存 ， 增 加 GC 负担 。 尽 量 在 WO 组 件 内 加 
入 缓冲 区 ， 可 以 提高 性 能 。 

如 果 将 同步 LO 方式 下 的 数据 传输 比 做 数据 传输 的 零星 方式 (这 里 
的 零星 是 指 在 数据 传输 的 过 程 中 是 以 零星 的 字 节 方式 进行 的 ) ， 那 么 
就 可 以 将 非 阻塞 IO 方式 下 的 数据 传输 比 作 数据 传输 的 集装箱 方式 (在 
字 节 和 低层 数据 传输 之 间 ， 多 了 一 层 缓冲 区 ， 因 此， 可 以 将 缓冲 区 看 
作 是 装载 字 节 的 集装箱 ) 。 大 家 可 以 想象 ， 如 果 我 们 要 运送 比较 少 的 
货物 ， 用 集装箱 好 像 有 点 不 太 合算 ， 而 如 果 要 运 庆 上 百 吨 的 货物 ， 用 
集装箱 来 运送 的 成 本 会 更 低 。 在 数据 传输 过 程 中 也 是 一 样 ， 如 果 数 据 
量 很 小 时 ， 使 用 同步 IO 方式 会 更 适合 ， 如 果 数 据 量 很 大 时 (一 般 以 GB 
为 单位 ) ， 使 用 非 阻塞 IO 方式 的 效率 会 更 高 。 因 此 ， 从 理论 上 说 ， 数 
据 量 越 大 ， 使 用 非 阻塞 YaO 方 式 的 单位 成 本 就 会 越 低 。 产 生 这 种 结果 的 
原因 和 缓冲 区 的 一 些 特 性 有 着 直接 的 关系 。 

如 图 2-7 所 示 ，Java 提 供 了 7 个 基本 的 缓冲 区 ， 分 别 由 7 个 类 来 管 
理 ， 它 们 都 可 以 在 java.nio 包 中 找到 。 这 7 个 类 分 别 是 ByteBuffer、 
ShortBuffer 、 IntBuffer ~ CharBuffer ~ FloatBuffer ~ DoubleBuffer 、 
LongBuffer。 


这 七 个 类 中 的 方法 类 似 ， 只 是 它们 的 返回 值 或 参数 和 相应 的 简单 
类 型 相对 应 ， 如 ByteBuffer 类 的 get 方 法 返回 了 byte 类 型 的 数据 ， 而 put 方 
法 需要 一 个 byte 类 型 的 参数 。 在 CharBuffer 类 中 的 get 和 put 方 法 返回 和 传 
弟 的 数据 类 型 就 是 char。 这 7 个 类 都 没有 public 构 造 方 法 ， 因 此 ， 它 们 不 
能 通过 new 来 创建 相应 的 对 象 实 例 。 这 些 类 都 可 以 通过 两 种 方式 来 创建 
相应 的 对 象 实例 。 


图 2-7 Java 缓 冲 区 7 君子 
1. 通 过 静态 方法 allocate 来 创建 缓冲 区 


这 七 类 都 有 一 个 静态 的 allocate 方 法 ， 通 过 这 个 方法 可 以 创建 有 最 
大 容量 限制 的 缓冲 区 对 象 。allocate 的 定义 如 下 : 

m ByteBuffer 类 中 的 allocate 方 法 一 public static ByteBuffer allocate 

(int capacity) 。 

m IntBuffer 类 中 的 allocate 方 法 一 public static IntBuffer allocate (int 
capacity) 。 

其 他 五 个 缓冲 区 类 中 的 allocate 方 法 定义 和 上 面 的 定义 类 似 ， 只 是 
返回 值 的 类 型 是 相应 的 缓冲 区 类 。 

allocate 方 法 有 一 个 参数 capacity， 用 来 指定 缓冲 区 容量 的 最 大 值 。 
capacity 的 不 能 小 于 0， 否 则 会 抛 出 一 个 llegalArgumentException 异 常 。 
使 用 allocate 来 创建 缓冲 区 ， 并 不 是 一 下 子 就 分 配给 缓冲 区 capacity 大 小 
的 空间 ， 而 是 根据 缓冲 区 中 存储 数据 的 情况 来 动态 分 配 缓冲 区 的 大 小 


(实际 上 ， 在 低层 Java 采 用 了 数据 结构 中 的 堆 来 管理 缓冲 区 的 大 小 ) ， 
此 ， 这 个 capacity 可 以 是 一 个 很 大 的 值 ， 如 1024*1024 (1M) o 
allocate 的 使 用 方法 如 下 : 

ByteBuffer byteBuffer-ByteBuffer.allocate(1024); 

IntBuffer intBuffer-IntBuffer.allocate( 1024); 

在 使 用 allocate 创 建 缓冲 区 时 应 用 注意 ，capacity 的 含义 随 着 缓冲 区 
的 不 同 而 不 同 。 如 创建 字 节 缓冲 区 时 ，capacity 指 的 是 字 节 数 。 而 在 创 
ERAI (int) 缓冲 区 时 ，capacity 指 的 是 int 型 值 的 数目 ， 如 果 转 换 成 字 
数 ，capacity 的 值 应 该 乘 4。 如 上 面 代码 中 的 intBuffer 缓 冲 区 最 大 可 容纳 
的 字 节 数 是 1024x4=4096 个 。 

2. 通 过 静态 方 法 wrap 来 创建 缓冲 区 。 

使 用 allocate 方 法 可 以 创建 一 个 空 的 缓冲 区 。 而 wrap 方法 可 以 利用 
已 经 存在 的 数据 来 创建 缓冲 区 。wrap 方 法 可 以 将 数组 直接 转换 成 相应 
类 型 的 缓冲 区 。wrap 方 法 有 两 种 重 载 形式 ， 它 们 的 定义 如 下 。 

ByteBuffer 类 中 的 wrap 方 法 : 

public static ByteBuffer wrap(byte[] array) 

public static ByteBuffer wrap(byte[] array,int offset,int length) 

IntBuffer 类 中 的 wrap 方 法 : 

public static IntBuffer wrap(byte[] array) 

public static IntBuffer wrap(byte[] array,int offset,int length) 

其 他 五 个 缓冲 区 类 中 的 wrap 方法 定义 和 上 面 的 定义 类 似 ， 只 是 返 
回 值 的 类 型 是 相应 的 缓冲 区 类 。 

应 用 程序 和 IO 设备 之 间 存 在 一 个 缓冲 区 ， 一 般 流 是 没有 缓冲 区 
的 ， 但 是 如 果 存 在 缓冲 区 ， 就 会 发 现 很 大 的 问题 。 一 个 缓冲 区 例子 代 
码 清单 2-15 所 示 。 


代码 清单 2-15 无 缓冲 区 示例 testCache 
import java.io.BufferedOutputStream; 
import java.io.DataOutputStream; 
import java.io.FileInputStream; 


import java.io.FileOutputStream; 


public class testCache [ 
public static void main(String[] args) throws Exception{ 
DataOutputStream out = new DataOutputStream( 
new BufferedOutputStream( 
new FileOutputStream("l.txt"))); 
out.writeChars ("hello"); 
FileInputStream in = new FileInput$Stream("l.txt"); 
int len = in.available(); 
byte[] b = new byte[len]; 
int actlen = in.read(b); 
String str - new String(b); 
System.out.println(str); 


} 


为 了 确保 问题 不 发 生 ， 清 单 2-15 所 示人 代码 中 使 用 了 
BufferedOutputStream ， 手 动 构造 出 了 一 个 缓冲 区 。 因 为 如 果 没 有 缓 ; 
区 ， 应 用 程序 每 次 WO 都 要 和 设备 进行 通信 ， 效 率 很 低 ， 因 此 缓冲 区 为 
了 提高 效率 ， 当 写 入 设备 时 ， 先 写 入 缓冲 区 ， 等 到 缓冲 区 有 足够 多 的 
数据 时 ， 就 整体 写 入 设备 。 这 就 是 问题 所 在 ， 上 个 例子 中 ， 当 我 们 写 
入 hello 时 ， 由 于 hello 占 用 空间 很 小 ， 所 以 暂时 存放 在 缓冲 区 中 ， 后 来 
输入 流 想 要 从 文件 中 读 取 ， 但 是 由 于 文件 中 没有 字 节 ， 所 以 不 能 读 取 
hello。 这 里 ， 解 决 方法 很 简单 ， 只 要 调用 out.flush () 或 者 out.close 

() 即 可 ， 这 是 把 缓冲 区 的 数据 手动 写 入 文件 。 代 码 如 清单 2-16 所 示 。 


代码 清单 2-16 增加 缓冲 区 后 示例 testCache 
import java.io.BufferedOutputStream; 
import java.io.DataOutputStream; 
import java.io.FileInputStream; 


import java.io.FileOutputStream; 


public class testCache { 
public static void main(String[] args) throws Exception{ 
DataOutputStream out = new DataOutputStream( 
new BufferedOutputStream( 
new FileOutputStream("l.txt"))); 
out.writeChars ("hello"); 
out.close();//inserted 
FileInputStream in = new FileInputStream("1.txt") ; 
int len = in.available(); 
byte[] b = new byte[len]; 
int actlen - in.read(b); 
String str - new String(b); 
System.out.println (str); 


} 


缓冲 区 溢出 是 一 种 常见 的 缓冲 区 使 用 不 当 导 致 的 缺陷 。 具 体 是 指 
当 计算 机 程序 向 缓冲 区 内 填充 的 数据 位 数 超过 了 缓冲 区 本 身 的 容量 ， 
溢出 的 数据 覆盖 在 合法 数据 上 。 理 想 情 况 是 ， 程 序 检查 数据 长 度 并 且 
不 允许 输入 超过 缓冲 区 长 度 的 字符 串 ， 但 是 绝 大 多 数 程序 都 会 假设 数 
据 长 度 总 是 与 所 分 配 的 存储 空间 相 匹配 ， 这 就 为 缓冲 区 溢出 埋 下 隐 
患 。 操 作 系 统 所 使 用 的 缓冲 区 又 被 称 为 堆栈 ， 在 各 个 操作 进程 之 间 ， 
指令 被 临时 存储 在 堆栈 当中 ， 堆 栈 也 会 出 现 缓冲 区 溢出 。 当 一 个 超 长 
的 数据 进入 到 缓冲 区 时 ， 超 出 部 分 融会 被 写 入 其 他 缓冲 区 ， 其 他 缓冲 
: n a 条 指令 的 指针 ， 或 者 是 其 他 程序 的 输出 内 

这 些 内 容 都 被 覆盖 或 者 破坏 掉 。 可 见 一 小 部 分 数据 或 者 一 套 指令 


的 溢出 就 可 能 导致 一 个 程序 或 者 操作 系统 崩溃 。JVM 由 于 内 置 的 安全 
措施 较 好 ， 所 以 缓冲 区 溢出 问题 不 是 很 严重 。 

综 上 所 述 ， 缓 冲 区 还 是 很 有 用 的 一 套 “ 漏 斗 " 机 制 ， 读 者 可 以 考虑 
在 自己 的 应 用 中 适当 使 用 。 


2.1.2 GPU/CPU 


所 有 的 软件 系统 都 离 不 开 计 算 ， 也 就 离 不 开 对 CPU/GPU 的 依赖 ， 
这 一 节 具 体 聊 聊 CPU/GPU 的 发 展 前 景 。 

2.12.1 CPU 发 展 前 景 分 析 

进入 新 世纪 以 来 ，CPU 进 入 了 更 高 速 发 展 的 时 代 ， 以 往 可 望 而 不 
可 即 的 1Ghz 大 关 被 轻松 突破 了 ， 在 市 场 分 布 方面 ， 仍 然 是 Intel 跟 AMD 
公司 在 两 雄 争霸 ， 它 们 分 别 推出 了 Pentium4、Tualatin 核 心 Pentium II 和 
Celeron ，Tunderbird 核 心 Athlon、AthlonXP 和 Duron 等 处 理 器 ， 竞 争 日 
mA. 

根据 最 新 的 报道 ， 英 特 尔 将 在 2015 年 推出 18 核 心 的 Broadwell 处 理 
器 。 同 时 另 一 份 报告 指出 ， 未 来 Broadwell 处 理 器 将 有 望 被 使 用 在 平板 
电脑 上 。 

此 外 ， 英 特 尔 还 计划 推出 8 核 至 10 核 的 高 性 能 桌面 和 服务 器 处 理 
器 。 现 在 该 公司 在 市 面 上 最 新 的 处 理 器 架构 为 Haswell，Broadwell 处 理 
器 将 在 2016 年 上 半年 上 市 。 目 前 英特尔 处 理 器 最 高 的 核心 数 为 12 个 。 
在 软件 能 够 支持 多 核 的 前 提 下 ， 显 然 更 多 的 核心 能 为 设备 带 来 更 好 的 
性 能 。 另 据 CPU World 报 道 ， 在 发 展 多 核 的 同时 ， 英 特 尔 在 节能 的 方向 
上 也 取得 了 进展 ， 未 来 Broadwell 处 理 器 的 功 耗 将 可 能 低 至 4.5 瓦 ， 这 将 
让 这 款 处 理 器 更 广泛 地 被 运用 到 平板 电脑 和 二 合 一 变形 本 上 ， 如 今 移 
动 计 算 正 是 英特尔 重点 关注 的 领域 。 

表 2-1 列 出 了 与 CPU 相关 的 一 些 术语 ， 这 些 术语 在 Java 编 程 中 都 会 
具体 涉及 ， 先 在 这 里 列 给 大 家 。 

表 2-1 CPU 相关 术语 


是 一 组 处 理 器 指令 ， 用 于 实现 对 内 存 操作 的 顺序 限制 

An Cache line 缓存 中 可 以 分 配 的 最 小 存储 单位 。 处 理 器 填写 缓存 线 时 会 加 
MEER, BRS PEN 

不 可 中 断 的 一 个 或 一 系列 操作 

LN prc 当 处 理 器 识别 到 从 内 存 中 读 取 操作 数 是 可 缓存 的 ， 处 理 器 读 
prse Bil ———- (LL, L2, L3 的 或 所 有 ) 


som Cache hit 如 果 进 行 高 速 缓存 行 填充 才 做 的 内 存 位 置 仍然 是 下 次 处 理 名 
访问 的 地 址 时 ， 处 理 器 从 缓存 中 读 取 操作 数 ， 而 不 是 从 内 存 
VR 
Write hit 当 处 理 器 将 操作 数 写 回 到 一 个 内 存 缓存 的 区 域 时 ， 它 首先 会 
检查 这 个 缓存 的 内 存 地 址 是 省 在 缓存 行 中 ， 如 果 存 在 一 个 有 
效 的 缓存 行 ， 则 处 理 器 将 这 个 操作 数 写 回 到 缓存 ， 而 不 是 写 
回 到 内 存 ， 这 个 操作 被 称 为 写 命中 


一 个 有 效 的 缓存 行 被 写 入 到 不 存在 的 内 在 区域 

缓存 的 最 小 操作 单位 

比较 并 交换 Compare and Swap CAS 操作 需要 输入 两 个 数值 ， 一 个 旧 值 和 一 个 新 值 ， 在 操作 
期 间 先 比较 旧 值 有 没有 发 生变 化 ， 如 果 没 有 发 生变 化 ， 才 交 
换 成 新 值 ， 发 生 了 变化 则 不 交换 

CPU 流水 线 CPU pipeline CPU 流水 线 的 工作 方式 就 像 工业 生产 商 的 装配 流水 线 ， 在 
CPU 中 由 5-6 个 不 同 功能 的 电路 单元 组 成 一 条 指令 处 理 流水 
线 ， 然 后 将 一 条 X86 指令 分 成 5-6 步 后 再 由 这 些 电路 单元 分 
别 执行 ， 这 样 就 能 实现 在 一 个 CPU 时 钟 周期 完成 一 条 指令 ， 
因此 提高 CPU 的 运算 速度 

内 存 顺序 冲突 。 | Memory order violation | 内 存 顺序 冲突 一 般 是 由 假 共享 引起 的 ， 假 共享 是 指 多 个 CPU 
同时 修改 同一 个 缓存 行 的 不 同 部 分 而 引起 其 中 一 个 CPU 的 
操作 无 效 ， 当 出 现 这 个 内 存 顺序 冲突 时 ，CPU 必须 清空 流水 
线 


2.1.2.2 GPU 发 展 前 景 分 析 
GPU (GraphicsProcessing Unit) 是 图 形 处 理 器 的 简称 ， 这 个 概念 
是 由 NVIDIA 公 司 在 发 布 GeForce256 绘 图 处 理 心 片 时 首先 提出 。 


GPU 使 显卡 减少 了 对 CPU 的 依赖 ， 并 分 担 了 部 分 原本 是 由 CPU 所 
担当 的 工作 ， 尤 其 是 在 进行 3D 图 形 处 理 时 ， 功 效 更 加 明显 。GPU 所 采 
a E E e 立方 环境 材质 贴图 和 顶点 混 

、 纹 理 压 缩 和 四 凸 映射 贴图 、 双 重 纹 理 四 像素 256 位 泻 染 引擎 等 。 

GPU 在 处 理 能 力 和 存储 器 带宽 上 相对 于 CPU 有 明显 优势 ， 在 成 本 
和 功 耗 上 也 不 需要 付出 太 大 代价 。 由 于 图 形 泻 染 的 高 度 并 行 性 ， 使 得 
GPU 可 以 通过 增加 并 行 处 理 单元 和 存储 器 控制 单元 的 方式 提高 处 理 能 
力 和 存储 器 带宽 。GPU 设 计 者 将 更 多 的 晶体 管用 作 执 行 单元 ， 而 不 是 
像 CPU 那 样 用 作 复 杂 的 控制 单元 和 缓存 并 以 此 来 提高 少量 执行 单元 的 
执行 效率 。 图 2-8 对 CPU 与 GPU 中 的 逻辑 架构 进行 了 对 比 。 


CPU GPU 


图 2-8 CPU 对 比 GPU 
CPU 的 整数 计算 、 分 支 、 远 辑 判 断 和 浮 点 运算 分 别 由 不 同 的 运算 
单元 执行 ， 此 外 还 有 一 个 浮 点 加 速 器 。 因 此 ，CPU 面 对 不 同类 型 的 计 
算 任务 会 有 不 同 的 性 能 表现 。 而 GPU 是 由 同一 个 运算 单元 执行 整数 和 
浮 点 计算 ， 因 此 ，GPU 的 整 型 计算 能 力 与 其 浮 点 能 力 相似 。 
总 的 来 说 ，GPU 较 CPU 来 说 ， 拥 有 以 下 这 些 优势 。 
四 更 高 的 内 存 带 宽 (MemoryBandwidth) 


GPU 运算 相对 于 CPU 还 有 一 项 巨大 的 优势 ， 那 就 是 其 内 存 子 系 
统 ， 也 就 是 GPU 上 的 显存 。 当 前 桌面 级 顶级 产品 3 通道 DDR3-1333 的 峰 
值 是 32GB/S， 实 测 中 由 于 诸多 因素 带宽 在 20GB/S$ 上 下 浮动 。AMDHD 
4870512MB 使 用 了 带宽 超 高 的 GDDR5 显 存 ， 内 存 总 线 数据 传输 率 为 
3.6T/s 或 者 说 107GB/s 的 总 线 带宽 。 存 储 器 的 超 高 带宽 让 巨大 的 浮 点 运 
算 能 力 得 以 稳定 吞吐 ， 也 为 数据 密集 型 任务 的 高 效 运行 提供 了 保障 。 

还 有 ， 从 GTX200 和 HD4870 系 列 GPU 开 始 ，AMD 和 NVIDIA 两 大 
厂商 都 开始 提供 对 双 精 度 运算 的 支持 ， 这 正 是 不 少 应 用 领域 的 科学 计 
算 都 需要 的 。NVIDIA 公司 最 新 的 Fermi 架 构 更 是 将 全 局 ECC 

(ErrorChecking and Correcting) 、 可 读 写 缓存 、 分 支 预测 等 技术 引入 
到 GPU 的 设计 中 ， 明 确 了 将 GPU 作为 通用 计算 核心 的 方向 。 

四 延迟 与 带宽 

GPU: 高 显存 带宽 和 很 强 的 处 理 能 力 提供 了 很 大 的 数据 吞吐 量 ， 
缓存 不 检查 数据 一 致 性 ， 直 接 访 问 显存 延 时 可 达 数 百 力 至 上 千 时 钟 周 
期 。 

CPU: 通过 大 的 缓存 保证 线程 访问 内 存 的 低 延 迟 ， 但 内 存 带 宽 
小 ， 执 行 单元 太 少 ， 数 据 吞吐 量 小 ， 需 要 硬件 机 制 保 证 缓存 命中 率 和 
数据 一 致 性 。 

尽管 GPU 计算 已 经 开始 新 露头 角 ， 但 GPU 并 不 能 完全 替代 X86 解 决 
方案 。 很 多 操作 系统 、 软 件 以 及 部 分 代码 现在 还 不 能 运行 在 GPU 上 ， 
所 谓 的 GPU+CPU 异 构 超 级 计算 机 也 并 不 是 完全 基于 GPU 进行 计算 。 一 
般 而 言 适 合 GPU 运算 的 应 用 特性 包括 运算 密集 型 、 高 度 并 行 、 控 制 简 
单 、 分 多 个 阶段 执行 这 些 方面 。 

前 面 说 过 ，GPU 计 算 的 优势 是 大 量 内 核 的 并 行 计 算 ， 瓶 颈 往往 是 
IO 带宽 ， 因 此 适用 于 计算 密集 型 的 计算 任务 。 目 前 的 GPU 开发 环境 很 
多 ， 主 要 有 如 下 5 种 。 

(1) CG (CforGraphics) 是 为 GPU 编程 设计 的 高 级 绘制 语言 ， 
NVIDIA 和 微软 联合 开发 ， 微 软 版 本 叫 HLSL，CG 是 NVIDIA 版 本 。Cg 
极力 保留 C 语 言 的 大 部 分 语义 ， 并 让 开发 者 从 硬件 细节 中 解脱 出 来 ，Cg 
同时 也 有 一 个 高 级 语言 的 其 他 好 处 ， 如 代码 的 易 重 用 性 ， 可 读 性 得 到 
是 高 ， 编 译 器 代码 优 。 


(2) CUDA (ComputeUnified DeviceArchitecture, Zt — it $3 28 
TJ) 是 由 NVIDIA 所 推出 的 一 种 集成 技术 ， 是 该 公司 对 于 GPGPU 的 正式 
名 称 。 通 过 这 个 技术 ， 用 户 可 利用 NVIDIA 的 GeForce8 以 后 的 GPU 和 和 较 
新 的 QuadroGPU 进 行 计 算 。 亦 是 首次 可 以 利用 GPU 作为 C- 编 译 器 的 开 
发 环境 。NVIDIA 营 销 的 时 候 ， 往 往 将 编译 器 与 架构 混合 推广 ， 造 成 混 
乱 。 实 际 上 ，CUDA 架 构 可 以 兼容 OpenCL 或 者 自家 的 C- 编 译 器 。 无 论 
是 CUDAC- 语 言 或 是 OpenCL， 指 令 最 终 都 会 被 驱动 程序 转换 成 PTX 代 
码 ， 交 由 显示 核心 计算 。 

(3) ATIStream 是 AMD 针 对 旗下 图 形 处 理 器 (GPU) 所 推出 的 通 
用 并 行 计 算 技 术 。 利 用 这 种 技术 可 以 充分 发 挥 AMDGPU 的 并 行 运 算 能 
力 ， 用 于 对 软件 进行 加 速 或 进行 大 型 的 科学 运算 ， 同 时 用 以 对 抗 竞 争 
对 手 的 nVIDIACUDA 技 术 。 与 CUDA 技 术 是 基于 自身 的 私有 标准 不 
同 ，ATIStream 技 术 基 于 开放 性 的 OpenCL 标 准 。 

(4) OpenCL (Open Computing Language， 开 放 计 算 语 言 ) 是 一 
个 为 异 构 平台 编写 程序 的 框架 ， 此 异 构 平 台 可 ) 由 CPU，GPU 或 其 他 
类 型 的 处 理 器 组 成 。OpenCL 由 一 门 用 于 编写 kernels (在 OpenCL 设 备 上 
BTN) 的 语言 (基于 C99) 和 一 组 用 于 定义 并 控制 平台 的 API 组 
成 。OpenCL 提 供 了 基于 任务 分 区 和 数据 分 区 的 并 行 计算 机 制 |。 

(5) OpenCL 类 似 于 另外 两 个 开放 的 工业 标准 OpenGL 和 
OpenAL， 这 两 个 标准 分 别 用 于 三 维 图 形 和 计算 机 音频 方面 。OpenCL 
扩展 了 GPU 用 于 图 形 生成 之 外 的 能 力 。OpenCL 由 非 盈利 性 技术 组 织 


KhronosGroup 掌 管 。 


总 的 来 说 ，CUDA 仅 能 用 于 NVIDIA 的 产品 ， 发 展 相 对 成 熟 ， 效 率 

高 ， 拥 有 丰富 的 文档 资源 。OpenCL 的 开放 标准 ， 抽 象 层 次 较 低 ， 较 多 

对 硬件 的 直接 操作 ， 代 码 需 要 根据 不 同 硬件 优化 。ATIStream 在 硬件 上 

已 经 有 了 基础 ， 但 只 有 低层 次 汇编 才能 使 用 所 有 的 硬件 资源 。 高 层次 

的 brook 是 基于 上 一 代 GPU 的 ， 缺 乏 良好 的 编程 模型 。CG 是 优秀 的 图 形 
学 开发 环境 ， 但 不 适 于 GPU 通 用 计算 开发 。 

2015 年 NVIDIA 公 司 推 出 的 Titan X 的 TDP 功 耗 为 250W (该 卡 仅 预 

留 了 一 个 8pin 和 一 个 6pin 供 电 接 口 ， 总 功 耗 不 会 超过 300W) ， 拥 有 6 组 

GPC (Graphics Processing Clusters， 图 形 处 理 集群 ) ， 每 一 集群 都 拥有 


4 组 SMM 单 元 ， 也 就 是 说 Titan X 总 共 拥 有 24 组 SMM 单 元 ，3072 个 
CUDA 核 心 。 


多 年 来 ， 有 很 多 将 Hadoop 或 MapReduce 应 用 到 GPU 的 科研 项 目 。 
Mars 可 能 是 第 一 个 成 功 的 GPU 的 MapReduce 框 架 。 采 用 Mars 技 术 ， 分 
析 WEB 数 据 (搜索 和 日 志 ) 和 处 理 WEB 文 档 的 性 能 提高 了 1.5~1.6 
倍 。 根 据 Mars 的 基本 原理 ， 很 多 科研 机 构 都 开发 了 类 似 的 工具 ， 提 高 
自己 数据 密集 型 系统 的 性 能 。 相 关 案 例 包 括 分 子 动力 学 、 数 学 建 模 
(如 Monte Carlo) 、 基 于 块 的 矩阵 乘法 、 财 务 分 析 、 图 像 处 理 等 。 

还 有 针对 网 格 计算 的 BOING 系 统 ， 它 是 一 个 快速 发 展 、 志 愿 者 驱 
动 的 中 间 件 系统 。 尽 管 没有 使 用 Hadoop，BOINC 已 经 成 为 许多 科研 项 
目 加 速 的 基础 。 例 如 ，GPUGRID 是 一 个 基于 BOINC 的 GPU 和 分 布 式 计 
算 的 项 目 ， 它 通过 执行 分 子 模拟 ， 帮 助 我 们 了 解 蛋 白质 在 健康 和 疾病 
情况 下 的 不 同 作 用 。 多 数 关 于 医药 、 物 理 、 数 学 、 生 物 等 的 BOINC 项 
目 也 可 以 使 用 Hadoop+GPU 技 术 。 

因此 ， 使 用 GPU 加 速 并 行 计 算 系 统 的 需求 是 存在 的 。 这 些 机 构 会 
投资 GPU 的 超级 计算 机 或 开发 自己 的 解决 方案 。 人 硬件 厂商 ， 如 Cray， 
已 经 发 布 了 配置 GPU 和 预 装 了 Hadoop 的 机 器 。Amazon 也 推出 了 EMR 
(Amazon Elastic MapReduce) ， 用 户 可 以 在 其 配置 了 GPU 的 服务 器 上 
使 用 Hadoop。 


数据 处 理 过 程 中 ，HDD、DRAM、CPU 和 GPU 必然 会 有 数据 交 
换 。 图 2-9 显 示 了 CPU 和 GPU 共同 执行 计算 时 ， 数 据 的 传输 。 


图 2-9 共同 计算 流程 图 


FLA: 数据 从 HDD 传 输 到 DRAM (CPU+GPU 计 算 的 初始 步骤 ) 

箭头 B: CPU 处 理 数据 (数据 流 : DRAM- > chipset- > CPU) 

箭头 C: GPU 处 理 数 据 (数据 流 : DRAM- > chipset- > CPU- > 
chipset- > GPU- > GDRAM- > GPU) 

OpenJDK 发 起 的 另外 一 个 非常 有 潜力 的 项 目 Sumatra， 引 在 通过 
GPU 来 大 幅 提高 Java 性 能 。 可 以 将 运行 Java 程 序 的 部 分 计算 工作 从 CPU 
移动 到 GPU。 此 想法 将 通过 Hotspot JVM 来 实现 ，Hotspot JVM 具 有 先进 
的 代码 性 能 运行 时 分 析 功 能 ， 开 发 者 将 可 以 查看 生成 的 GPU 代码 、 
绕 代码 的 垃圾 收集 等 。 该 项 目的 目的 是 提升 性 能 ， 但 是 并 未 影响 到 编 
译 时 间 、 内 存 消耗 和 生成 代码 的 质量 等 。 


CPU 与 GPU 结合 
CPU/GPU 巡 构 温 合并 行 系统 以 其 强劲 计算 能 、 高 性 价 比 和 低能 
耗 等 特点 成 为 新 型 高 能 计算 平台 ， 但 其 复杂 体系 二 构 为 并 行 计算 研 


究 提出 了 巨大 挑战 。 CPUGPU 协 同 并 行 计算 属于 新 兴 和 开 完 领域 ， 是 
个 开放 的 课题 。 


采用 通用 多 核 微 处 理 器 与 定制 加 速 协 处 理 器 相 结合 的 异 构 混合 体 
系 结构 成 为 构造 千 万 亿 次 计算 机 系统 的 一 种 可 行 途径 。 甚 至 有 专家 预 
言 ， 今 后 的 高 性 能 计算 平台 将 会 成 为 以 异 构 混合 体系 结构 为 主 的 格 
局 。 在 众多 异 构 混合 平台 中 ， 基 于 CPU/GPU 异 构 协 同 的 计算 平台 具有 
很 大 的 发 展 潜力 。 正 由 于 GPU 所 具有 的 强劲 计算 能 力 、 高 性 能 /价格 比 
和 高 性 能 /能 耗 比 ， 在 当今 追求 绿色 高 性 能 计算 的 时 代 ，GPU 的 计算 优 
势 受 到 越 来 越 多 的 关注 。 除 专业 图 形 应 用 外 ，GPU 已 用 于 大 量 的 通用 
计算 问题 ， 并 形成 了 GPU 通用 计算 研究 领域 。 

GPU 和 CPU 在 设计 思路 上 存在 很 大 差异 ，CPU 为 优化 串 行 代码 而 
设计 ， 将 大 量 的 晶体 管 作为 控制 和 缓存 等 非 计 算 功 能 ， 注 重 低 延迟 地 
快速 实现 某 个 操作 ; GPU 则 将 大 量 的 晶体 管用 作 ALU 计 算 单 元 ， 适 合 
高 计算 强度 (S/H) 的 应 用 。 在 协同 并 行 计算 时 ，CPU 和 
GPU 应 各 取 所 长 ， 快 速 、 高 效 协同 地 完成 高 性 能 计算 任务 。 另 外 ， 除 
管理 GPU 计算 任务 外 ，CPU 也 应 当 承 担 一 部 分 科学 计算 任务 。 需 要 充 
分 挖掘 CPU 和 GPU 的 计算 潜能 ， 使 其 达到 高 效 协 同 的 计算 效果 。 新 型 
异 构 混合 体系 结构 对 大 规模 并 行 算法 研究 提出 了 新 的 挑战 ， 迫 切 需 要 
深入 研究 与 该 体系 结构 相 适 应 的 并 行 算法 。 针 对 CPU/GPU 异 构 混 合体 
系 结构 的 高 性 能 计算 平台 ， 研 究 相 应 的 协同 并 行 计算 技术 ， 设 计 并 实 
现 大 型 科学 及 工程 计算 问题 的 新 型 并 行 算法 ， 具 有 重大 的 理论 和 实际 
意义 。 

在 CPU/GPU 异 构 混 合 平台 中 ，CPU 和 GPU 具有 不 同 的 硬件 特点 和 
计算 方式 ， 因 此 基于 异 构 混合 平台 进行 并 行 算法 设计 时 ， 必 须 密切 结 
合 其 底层 硬件 特点 ， 使 算法 充分 利用 混合 系统 中 各 类 型 处 理 器 的 性 能 
优势 。 鉴 于 GPU 研究 属于 新 兴 领 域 ， 目 前 大 部 分 算法 研究 工作 是 已 有 
算法 向 异 构 混合 平台 的 移植 ， 针 对 该 平台 的 全 新 算法 较 少 。CPU 和 
GPU 都 存在 存储 墙 问 题 ，CPU 主 要 通过 多 层次 存储 结构 来 缓解 该 问 
题 ， 而 GPU 则 使 用 硬件 多 线程 技术 来 隐藏 高 开销 的 访 存 延迟 。 面 向 异 
构 混 合 系统 的 高 效 并 行 算法 应 具有 以 下 特点 。 

m 异 构 感 知 的 : 根据 底层 硬件 特点 设计 算法 ， 使 体系 结构 一 算法 组 
合 发 挥 出 最 大 性 能 。 

sees: 高 计算 强度 是 并 行程 序 高 计算 效率 的 普遍 要 求 ， 对 
GPU 尤其 重要 ， 否 则 GPU 的 高 浮 点 计算 性 能 优势 根本 得 不 到 发 挥 。 


m CPU 与 GPU 交互 开销 小 : 包括 数据 传输 开销 及 同步 开销 。 
四 CPU 与 GPU 间 交 互 是 协同 并 行 计算 不 可 避免 的 : 应 通过 优化 算法 
来 减少 数据 传输 次 数 和 数据 量 以 及 同步 开销 。 


2.1.3 硬盘 


软件 系统 架构 离 不 开 硬 盘 ， 这 是 由 于 大 多 数 软件 都 需要 有 存储 介 
质 支 撑 ， 不 然 软 件 运 行 过 程 中 产生 出 来 的 数据 没有 地 方 保存 ， 所 以 我 
们 也 需要 一 定 程度 地 了 解 硬盘 相关 知识 。 

硬盘 对 于 计算 机 来 说 ， 就 像 人 们 要 吸收 和 存储 大 量 信息 ， 离 不 开 
头脑 一 样 。 信 息 越 来 越 多 ， 硬 盘 容 量 也 在 飞速 增长 ， 一 般 来 说 ，60% 的 
年 度 容 量 增长 速度 对 应 的 是 40% 的 价格 减少 。 

SATA (Serial ATA) 口 的 硬盘 又 叫 串 口 硬盘 ， 是 未 来 PC 机 硬盘 的 
趋势 ， 现 已 基本 取代 了 传统 的 PATA 硬 盘 。SAIA 的 全 称 是 Serial 
Advanced Technology Attachment, Intel. APT. Dell, IBM, 2538. 33 
拓 这 几 大 厂商 组 成 的 Serial ATA 委 员 会 正式 确立 了 Serial ATA 1.0 规 范 ， 
2002 年 ， 虽 然 串 行 ATA 的 相关 设备 还 未 正式 上 市 ， 但 Serial ATA 委 员 会 
已 抢先 确立 了 Serial ATA 2.0 规 范 。 Serial ATA 末 用 串 行 连接 方式 ， 串 行 
AIA 总 线 使 用 艇 入 式 时 钟 信号 ， 有 具备 了 更 强 的 纠 错 能 力 ， 与 以 往 相 比 其 
最 大 的 区 别 在 于 能 对 传输 指令 〈 不 仅仅 是 数据 ) 进行 检查 ， 如 果 发 现 
错误 会 自动 矫正 ， 这 在 很 大 程度 上 提高 了 数据 传输 的 可 靠 性 。 串 行 接 
口 还 具有 结构 简单 、 支 持 热 插 拔 的 优点 。 

固态 硬盘 (Solid State Drives) ， 简 称 固 盘 ， 固 态 硬盘 用 固态 电子 
存储 心 片 阵 列 而 制 成 的 硬盘 ， 由 控制 单元 和 存储 单元 (FLASH 心 片 、 
DRAM 芯 片 ) 组 成 。 固 态 硬 盘 在 接口 的 规范 和 定义 、 功 能 及 使 用 方法 
上 与 普通 硬盘 的 完全 相同 ， 在 产品 外 形 和 尺寸 上 也 完全 与 普通 硬盘 一 
致 。 被 广泛 应 用 于 军事 、 车 载 、 工 控 、 视 频 监控 、 网 络 监控 、 网 络 终 
端 、 电 力 、 医 疗 、 航 空 、 导 航 设 备 等 领域 。 

闪存 (Flash Memory) 是 一 种 长 寿命 的 非 易 失 性 〈 在 断 电 情况 下 仿 
能 保持 所 存储 的 数据 信息 ) 的 存储 器 ， 数 据 删 除 不 是 以 单个 的 字 节 为 
单位 而 是 以 固定 的 区 块 为 单位 (注意 : NOR Flash 为 字 节 存储 ) ， 区 块 
大 小 一 般 为 256KB 到 20MB 。 闪 存 是 电子 可 探 除 只 读 存 储 器 

(EEPROM) 的 变种 ， 闪 存 与 EEPROM 不 同 的 是 ，EEPROM 能 在 字 节 


水 平 上 进行 删除 和 重 写 而 不 是 整个 芯片 擦 写 ， 而 闪存 的 大 部 分 心 片 需 
要 块 擦 除 。 由 于 其 断 电 时 仍 能 保存 数据 ， 闪 存 通常 被 用 来 保存 设置 信 
息 ， 如 在 电脑 的 BIOS (基本 程序 ) 、PDA (个 人 数字 助理 ) 、 数 码 相 
机 中 保存 资料 等 。 

硬盘 发 展 至 今 已 经 有 50 余 年 的 历史 ， 在 这 几 十 年 的 历程 里 ， 硬 盘 
的 体积 越 来 越 小 而 容量 则 越 来 越 大 ， 硬 盘 的 转速 与 接口 也 在 与 时 俱 
进 。 第 一 款 硬盘 面世 的 时 候 ， 它 有 两 个 冰箱 那么 宽 ， 内 部 安装 了 50 个 
直径 两 英尺 的 磁盘 ， 重 量 约 1 吨 ， 而 现在 微 硬 盘 、CF 硬 盘 仅仅 才 硬 币 大 
小 ， 这 种 变化 真是 太 惊 人 了 。 

由 于 硬盘 的 IO 速度 一 直 是 造成 软件 系统 瓶颈 的 因素 之 一 ， 所 以 很 
多 时 候 我 们 在 设计 高 吞吐 量 系统 的 时 候 会 避 开 硬盘 ， 比 如 通过 消息 队 
列 的 方式 加 快 数据 处 理 流程 的 流动 。 比 如 异 构 架构 的 服务 器 可 能 会 给 
每 颗 处 理 器 (包括 CPU 和 GPU 的 处 理 器 ， 比 如 说 英 伟 达 公司 的 K1、 
X1) 配置 闪存， 通过 闪存 来 存储 需要 的 操作 系统 、 软 件 ， 通 过 从 闪存 
加 载 的 方式 避免 使 用 硬盘 ， 又 通过 内 存 来 保证 系统 的 运行 ， 但 是 这 样 
不 能 解决 数据 持久 化 需求 。 

针对 海量 存储 的 需求 领域 ， 业 界 有 两 点 共识 很 重要 。 

(1) 海量 存储 不 可 能 再 以 传统 的 块 ， 文 件 系统 ， 应 用 的 访问 方式 
进行 建设 ， 未 来 的 主流 很 可 能 会 是 对 象 存 储 ; 

(2) 传统 的 服务 器 或 存储 系统 ， 增 加 了 存储 成 本 和 管理 难度 ， 未 
来 的 应 用 将 向 更 细 颗 粒度 的 存储 组 件 发 展 ; 

IP 人 硬盘 就 是 在 这 样 的 背景 下 产生 了 ， 也 是 在 这 样 的 背景 下 与 海量 
存储 联系 在 了 一 起 。 

首先 ， 对 于 主机 +NIC+IP 硬 盘 与 传统 的 主机 +SAS HBA+ 传 统 硬盘 
相 比 较 成 本 优势 明显 ， 且 维护 管理 方便 ; 其 次 ， 耳 硬盘 的 访问 方式 基 
于 KEY/VALUE ， 某 种 意义 上 来 说 ， 就 是 一 种 对 象 存 储 ， 在 支持 大 规模 
并 行 访问 上 ， 显 然 是 有 着 得 天 独 厚 的 优势 ; 再 则 ， 每 个 了 了 硬盘 即 是 一 
个 最 细 粒 度 的 存储 组 件 ， 扩 容 非常 方便 ; 所 以 ， 相 比较 传统 的 SAS 盘 ， 
IP 硬 盘 在 成 本 ， 性 能 及 可 靠 性 上 都 占有 优势 ， 且 IP 硬 盘 更 容量 管理 ， 对 
于 对 象 存储 天 然 的 支持 的 特性 ， 使 得 IP 硬 盘 将 是 未 来 发 展 的 一 个 重要 
方向 。 


现在 市 场 上 的 了 硬盘 产品 主要 是 希捷 的 卫 硬 盘 ， 和 希捷 推出 了 kinetic 
系统 加 IP 硬 盘 的 整体 解决 方案 ， 这 个 系统 基于 KEY/VALUE 的 存储 方 
式 ， 存 储 单位 为 IMB 大 小 ， 并 以 lib 库 +IP 硬 盘 的 形式 提供 出 来 ;) 大 数据 
技术 部 云 存储 组 目前 针对 希捷 推出 的 这 套 Kinetic 系 统 的 也 硬盘， 分 别 测 
试 过 Python、C、Java 版 本 ， 单 盘 异 步 写 可 以 达到 50MB/S 的 性 能 ， 基 本 
能 满足 我 们 的 性 能 要 求 ; 其 整体 解决 方案 给 我 们 的 存储 架构 设计 方面 
带 来 了 一 些 启发 ， 我 们 构想 ， 新 一 代 的 存储 产品 ， 会 是 基于 对 象 的 存 
储 ， 由 现在 的 前 端 + 元 数据 服务 器 + 数据 服务 器 ， 变 更 为 前 端 + 元 数据 服 
务 器 +IP 硬 盘 ， 节 省 开发 存储 服务 器 的 时 间 成 本 ， 但 会 带 来 大 量 索 引 I/O 
的 管理 难度 ， 后 期 的 存储 设计 会 集中 在 如 何 处 理 海量 的 元 数据 索引 
上 ， 对 于 可 靠 性 的 保护 也 从 后 端 转移 到 前 端 ， 对 于 网 络 raid 的 研究 就 显 
得 比较 迫切 ; 目前 正 积极 同 希捷 IP 硬 盘 部 门 进行 沟通 ， 深 入 了 解 卫 硬 盘 
的 特性 以 及 设计 思路 ， 从 技术 、 市 场 方面 进行 分 析 ， 投 入 人 员 进 行 预 
研 ， 深 入 软件 定义 存储 。 

总 的 来 说 ，IP 硬 盘 的 设计 对 于 冷 数 据 ， 也 即 低 负 载 、 以 带宽 吞吐 
量 大 块 连续 IO 为 主 的 场景 有 着 很 好 的 支持 。 结 合 现在 比较 流行 的 
Erasure code 技 术 ， 首 先 对 数据 进行 分 片 ， 然 后 再 保存 到 各 个 IP 硬 盘 
中 ， 这 样 为 更 高 的 数据 可 靠 性 和 存储 利用 率 提供 了 可 能 。 


2.1.4 网 络 架 构 


现代 软件 系统 ， 特 别 是 集群 式 、 分 布 式 软件 架构 方式 的 系统 ， 系 
统 内 部 一 定 牵 扯 到 网 络 带 宽 问 题 ， 这 样 也 就 涉及 到 了 网 络 设 计 、 架 构 
技术 。 比 如 国内 腾讯 、 百 度 、 阿 里 三 甲 互 联网 公司 ， 为 满足 用 户 访 
问 ， 平 均 每 两 周 就 有 1000 台 以 上 服务 器 上 线 ， 这 样 的 上 线 速度 和 数 
量 ， 对 整个 数据 中 心 的 自动 化 运 维 提出 了 极 高 的 要 求 ， 基 础 的 网 络 同 
样 需要 适应 这 种 需求 。 

软件 系统 内 部 实现 了 中 心 节 点 管理 服务 为 例 ， 管 理 各 个 具体 执行 
某 样 业务 的 计算 节点 ， 那 么 中 心 节 点 与 计算 节点 之 间 ， 计 算 节 点 与 计 
算 节点 之 间 ， 网 络 负载 问题 是 我 们 必须 要 考虑 的 。 无 论 系 统 采用 的 
Master-Slave[12] 式 架构 ， 或 是 去 中 心 化 的 ZooKeeper[13] 式 通信 方式 架 
构 ， 我 们 都 不 能 无 视 网 络 风暴 存在 的 可 能 性 ， 所 以 这 里 具体 和 大 家 聊 
聊 网 络 相关 知识 。 


当前 最 火 的 名 词 可 能 数据 中 心得 算 一 个 吧 ， 随 着 云 计算 的 日 益 火 
热 ， 数 据 中 心 概 念 也 被 热 炒 。 新 一 代数 据 中 心 解决 方案 ， 目 标 是 在 以 
太 网 和 IP 技 术 的 基础 上 ， 实 现 数据 中 心 基础 网 络 架 构 的 统一 ， 以 及 安 
全 策略 的 统一 部 署 和 数据 中 心 资源 的 统一 管理 ， 以 帮助 用 户 简化 传统 
数据 中 心 的 基础 架构 、 加 固 核心 数据 的 保护 、 优 化 数据 中 心 的 应 用 性 
能 。 

网 络 是 数据 中 心 的 一 个 重要 基础 设施 ， 通 常 可 以 分 为 两 大 部 分 : 
前 端 计算 网 络 、 后 端 存储 网 络 。 后 端的 存储 网 络 目前 主要 是 FC 网 络 ， 
不 过 随 着 IP 技 术 的 发 展 ， 采 用 FCoE 技 术 融 合 前 后 端 网 络 成 为 一 种 趋 
势 。 

传统 的 机 房 前 端 激素 网 络 主要 由 大 量 的 二 层 接 入 设备 及 少量 的 三 
层 设 备 组 成 ， 即 分 为 接 入 层 、 汇 聚 层 、 核 心 层 。 传 统 的 网 络 模型 在 很 
长 一 段 时 间 内 ， 支 撑 了 各 种 类 型 的 数据 中 心 ， 但 随 着 互联 网 的 发 展 以 
及 云 计 算 的 崛起 ， 已 经 不 能 再 有 效 地 支撑 数据 中 心 了 。 万 兆 以 太 网 从 
起 步 到 目前 逐渐 成 为 应 用 主流 ， 延 续 了 以 太 网 技术 发 展 的 主 基调 ， 赁 
借 其 技术 优势 ， 蔡 代 其 他 网 络 接 入 技术 ， 成 为 高 性 能 网 络 的 不 二 选 
择 。 

传统 的 数据 中 心 内 ， 服 务 器 主要 用 于 对 外 提供 业务 访问 ， 不 同 的 
业务 通过 安全 分 区 及 VLAN 隔 离 。 一 个 分 区 通常 集中 了 该 业务 所 需 的 
计算 、 网 络 及 存储 资源 ， 不 同 的 分 区 之 间或 者 禁止 互 访 ， 或 者 经 由 核 
心 交 换 通 过 三 层 网 络 交 互 ， 数 据 中 心 的 网 络 流量 大 部 分 集中 于 南北 
向 。 此 种 设计 下 ， 不 同 分 区 间 计 算 资 源 无 法 共享 ， 资 源 利用 率 低下 的 
问题 越 来 越 突 出 。 通 过 虚拟 化 技术 、 云 计算 管理 技术 等 ， 将 各 个 分 区 
间 的 资源 进行 池 化 ， 实 现 数据 中 线 内 资源 的 有 效 利用 ， 虚 拟 机 迁移 、 
数据 同步 、 数 据 备 份 、 协 同 计算 等 在 数据 中 心 内 开始 实现 部 署 ， 数 据 
中 心 内 部 东西 向 流量 开始 大 幅度 增加 。 

随 着 虚拟 化 数据 中 心 的 扩大 ， 以 及 云 化 管理 的 深入 ， 物 理 网 络 的 
种 种 限制 越 来 越 不 适应 虚拟 化 的 要 求 ， 由 此 提出 了 VXLAN、NVGRE 
等 网 络 Overlay 方 案 ， 在 这 一 方案 下 ， 物 理 网 络 中 的 东西 向 流量 类 型 也 
逐渐 由 二 层 向 三 层 转 变 ， 通 过 增加 封装 ， 将 网 络 拓扑 由 物理 二 层 变 为 
逻辑 二 层 ， 同 时 提供 逻辑 二 层 的 划分 管理 ， 更 好 地 满足 了 多 用 户 的 需 
求 。VXLAN、NVGRE 等 Overlay 技 术 都 是 通过 将 MAC 封 装 在 IP 之 上 ， 


实现 对 物理 网 络 的 屏蔽 ， 解 决 了 物理 网 络 VLAN 数 量 限制 、 接 入 交换 机 
MAC 表 项 有 限 等 问题 。 通 过 提供 统一 的 逻辑 网 络 管理 工具 ， 方便 地 实 
现 了 虚拟 机 HA 迁移 时 网 络 策略 跟随 的 问题 。 

随 着 虚拟 化 技术 的 进步 ， 每 台 物 理 服务 器 的 虚拟 机 数量 由 8 人 台 提 升 
至 16 台 、32 人 台 甚 至 更 多 ， 这 使 得 低 延 迟 的 服务 器 间 通 信和 更 高 的 双向 
带宽 需求 变 得 更 加 迫切 。 然 而 传统 的 网 络 核心 、 汇 聚 和 接 入 的 三 层 结 
构 ， 服 务 器 虚拟 化 后 还 有 一 个 虚拟 交换 机 层 ， 而 随 着 刀片 服务 器 的 广 
泛 应 用 ， 刀 片 式 交换 机 也 给 网 络 添加 了 一 层 交 换 。 如 此 之 多 的 网 络 层 
次 ， 使 得 数据 中 心计 算 节 点 间 通 信 延 时 大 幅 增 加 ， 这 就 需要 网 络 化 染 
构 向 扁平 化 方向 发 展 ， 最 终 的 目标 是 在 任意 两 点 之 间 尽 量 减少 网 络 染 
构 的 数目 。 网 络 扁平 化 后 ， 减 少 了 中 间 层 次 ， 对 核心 设备 交换 能 力 要 
求 降低 ， 对 于 数据 中 心 而 言 ， 后 续 扩 容 只 需要 以 标准 的 机 柜 为 单位 增 
加 即 可 。 

数据 中 心 的 这 些 变化 ， 对 网 络 提出 了 更 高 的 要 求 。Fabric 物 理 网 络 
染 构 成 为 解决 上 述 难 题 的 一 个 重要 手段 。Fabric 网 络 染 构 就 是 通过 骨干 
网 络 节点 间 分 层 互 联 或 全 互联 的 方式 ， 提 供 所 有 接 入 网 络 的 各 类 节点 
间 的 无 差异 互 访 。 在 Fabric 架 构 下 ， 所 有 节点 可 以 全 互联 ， 也 可 以 分 层 


互联 。 分 层 结 构 下 ， 节 点 类 型 分 为 骨干 节点 和 叶子 结 点 ， 上 骨干 节 点 与 
叶子 节点 间 全 连接 ， 上 骨干 节 点 仅 用 作 转 发 ， 叶 子 结 点 作为 二 三 层 的 边 


界 。 在 这 种 架构 下 ， 网 络 全 互联 形成 的 大 量 等 价 路 径 既 保证 了 链 路 的 
宛 余 可 靠 ， 又 提高 了 整个 Fabric 网 络 的 吞吐 量 ， 扁 平 的 网 络 结构 保证 了 
任意 节点 间 较 高 的 连接 速率 ， 同 时 对 任意 类 型 流量 均 拥有 极 低 的 时 
1E, 

未 来 SDN[14] 提 供 了 可 行 的 解决 方案 。 它 通过 集中 的 控制 器 来 实 
现 对 整 网 设备 的 监控 和 管理 ， 利 用 软件 的 灵活 、 动 态 可 扩展 ， 提 供 丰 
富 的 管理 控制 策略 ， 通 过 开放 相关 的 API， 可 以 集成 第 三 方 APP， 实 现 
更 多 的 个 性 化 的 网 络 控制 。SDN 网 络 是 一 种 全 新 的 网 络 。 在 这 样 的 网 
络 中 ， 控 制 器 就 是 大 脑 ， 它 掌控 全 局 ， 学 习 整 网 的 拓扑 ， 管 理 网 络 中 
的 各 个 节点 。 网 络 中 的 其 他 节点 ， 只 需要 向 “大 脑 * 上 报 网 络 变化 ， 并 
按照 “< 大脑” 的 指挥 ， 完 成 自己 的 工作 即 可 。SDN 的 发 展 存在 不 确定 
性 ， 传 统 的 南 向 接口 OpenFlow 会 越 来 越 复杂 ， 现 有 网 络 设备 无 法 简单 
升级 支持 ， 同 时 满足 大 流 表 的 需求 将 大 幅 提 高 心 片 成 本 ; 控制 器 发 展 
不 统一 ， 各 个 厂家 都 在 争夺 自己 在 未 来 SDN 网 络 的 话语 权 ， 标 准 化 进 


行 缓慢 ， 各 种 私有 的 协议 加 入 导致 未 来 网 络 成 为 少数 玩家 的 地 盘 。 但 
是 ,无论 具体 实现 形式 如 何 ，SDK 这 种 集中 管控 、 灵 活动 态 的 网 络 音 
署 必 将 成 为 未 来 的 发 展 趋势 。 


2.2 新 兴 技 术 


1944 年 的 时 候 ， 最 好 的 人 类 计算 机 每 隔 几 秒 钟 仅 可 以 实现 一 次 加 
法 或 乘法 。 因 此 ， 一 般 的 解决 方案 是 将 问题 分 解 为 较 小 的 任务 ， 这 些 
小 任务 可 以 由 不 同 的 人 同时 执行 ， 每 次 以 相同 的 计算 复杂 度 运行 乘法 
计算 。 

70 年 后 ， 计 算 机 架构 师 面临 类 似 的 挑战 ， 并 且 采 用 了 类 似 的 解决 
方案 。 虽 然 单个 计算 设备 计算 速度 很 快 ， 但 是 物理 约束 对 其 速度 仍然 
有 限制 。 因 此 ， 如 今 的 计算 趋势 是 普 适 并 行 计算 。 单 处 理 器 包含 流水 
线 、 并 行 指令 、 预 测 执行 和 多 线程 。 本 质 上 ， 从 台式 计算 机 到 强大 的 
超级 计算 机 ， 每 个 计算 机 系统 都 包含 多 处 理 器 。 

通常 来 讲 ， 分 布 式 计算 和 集中 式 计算 相反 。 并 行 计算 领域 与 分 布 
式 计算 在 很 大 程度 上 有 交 亚 ， 云 计算 与 分 布 式 计算 、 集 中 式 计算 、 并 
行 计算 都 有 一 部 分 的 交集 。 

集中 式 计算 : 这 种 计算 模式 是 将 所 有 计算 资源 集中 在 一 个 物理 系 
统 之 内 。 所 有 资源 (处理 器 、 内 存 、 存 储 器 ) 是 全 部 共享 的 ， 并 且 紧 
耦合 在 一 个 集成 式 的 操作 系统 中 。 许 多 数据 中 心 和 超级 计算 机 都 是 集 
中 式 系统 ， 但 它们 都 被 用 于 并 行 计算 、 分 布 式 计算 和 云 计 算 应 用 中 。 

并 行 计算 : 在 并 行 计算 中 ， 所 有 处 理 器 或 是 紧 辜 合 于 中 心 共享 内 
存 或 是 松 耦 合 于 分 布 式 内 存 。 一 些 学 者 称 之 为 并 行 处 理 。 处 理 器 间 通 
信 通 过 共享 内 存 或 通过 消息 传递 完成 。 通 常 称 有 并 行 计算 能 力 的 计算 
系统 为 并 行 计算 机 。 运 行 在 并 行 计算 机 上 的 程序 称 为 并 行程 序 。 编 写 
并 行程 序 的 过 程 称 为 并 行 编程 。 

分 布 式 计算 ; 这 是 一 个 计算 机 科学 和 工程 中 研究 分 布 式 系统 的 领 
域 。 一 个 分 布 式 系统 由 众多 自治 的 计算 机 组 成 ， 各 自 拥有 其 私有 内 
存 ， 通 过 计算 机 网 络 通信 。 分 布 式 系统 中 的 信息 交换 通过 消息 传递 的 
方式 完成 。 运 行 在 分 布 式 系统 上 的 程序 称 为 分 布 式 程序 。 编 写 分 布 式 
程序 的 过 程 称 为 分 布 式 编程 。 


云 计算 : 一 个 互联 网 云 的 资产 可 以 是 集中 式 的 也 可 以 是 分 布 式 
的 。 云 采用 分 布 式 计算 或 并 行 计算 ， 或 两 者 兼 有 。 云 可 以 在 集中 的 或 
分 布 式 的 大 规模 数据 中 心 之 上 ， 由 物理 的 或 虚拟 的 计算 资源 构建 。 

普 适 计算 : 指 在 任何 地 点 和 时 间 通 过 有 线 或 者 无 线 网 络 使 用 普遍 
的 设备 进行 计算 。 物 联网 是 一 个 日 常生 活 对 象 《包括 计算 机 、 传 感 
器 、 人 等 ) 网 络 化 的 连接 。 物 联网 通过 互联 网 云 实 现任 何 对 象 在 任何 
地 点 和 时 间 的 普 适 计 算 。 

关于 云 计算 技术 、 大 数据 相关 技术 、 分 布 式 技术 、 虚 拟 化 技术 以 
及 物 联网 技术 ， 不 再 一 一 介绍 ， 相 关内 容 可 参阅 本 书 附 赠 资 源 (可 到 
“博文 视点 ”网 站 下 载 ) o 


[112 Java 无 法 直接 访问 到 操作 系统 底层 (如 系统 硬件 等 ) ， 为 此 Java 使 用 native 方 法 来 扩展 Java 程 序 的 功能 。 

[2]3 Hip-Hop 是 起 源 于 源 自 于 街头 的 一 种 黑人 文化 ， 也 泛 指 rap (说 唱 乐 ) 。 

[3]4 即 CPU 分 配给 各 个 程序 的 时 间 ， 每 个 线程 被 分 配 一 个 时 间 段 ， 称 作 它 的 时 间 片 ， 即 该 进程 允许 运行 的 时 间 ， 使 各 个 程 
序 从 表面 上 看 是 同时 进行 的 。 

[4] 随机 存 取 存 储 器 (random access memory, RAM) 又 称 作 “ 随 机 存储 器 >”， 是 与 CPU 直接 交换 数据 的 内 部 存储 器 ， 也 叫 
主 存 (内 存 ) 。 它 可 以 随时 读 写 ， 而 且 速 度 很 快 ， 通 常 作 为 操作 系统 或 其 他 正在 运行 中 的 程序 的 临时 数据 存储 媒介 。 

[5] JClassLib 不 但 是 一 个 字 节 码 阅读 器 而 且 还 包含 一 个 类 库 允 许 开发 者 读 取 ， 修 改 ， 写 入 Java Class 文 件 与 字 节 码 。 

[6] BPGarbage Collection. 


[718 OpenJDK 做 为 GPL 许可 (GPL-licensed) 的 Java 平 台 的 开源 化 实现 ，Sun 正 式 发 布 它 已 经 六 年 有 余 。 从 发 布 那 一 时 刻 
起 ，Java 社 区 的 大 众 们 就 又 开始 努力 学 习 ， 以 适应 这 个 新 的 开源 代码 基础 (code-base) 。 


[8]9 由 AliJVM 团 队 发 布 ， 是 AliJVM 团 队 基于 OpenJDK HotSpot VM 发 布 的 国内 第 一 个 优化 、 定 制 且 开 源 的 服务 器 版 Java 
虚拟 机 。 目 前 已 经 在 淘宝 、 天 猫 上 线 ， 全 部 替换 了 Oracle 官 方 JVM 版 本 。 


[9] JIT (justin time) 编译 器 。 当 Java 执 行 runtime 环 境 时 ， 每 遇 到 一 个 新 的 类 ，JIT 编 译 器 在 此 时 就 会 针对 这 个 类 进行 编 
译作 业 。 经 过 编译 后 的 程序 ， 被 优化 成 相当 精简 的 二 进 制 ， 这 种 程序 的 执行 速度 相当 快 。 


[10] 即 类 加 载 器 ， 用 来 加 载 Java 类 到 Java 虚拟 机 中 。 与 普通 程序 不 同 的 是 。Java 程 序 (class 文 件 ) 并 不 是 本 地 的 可 执行 
程序 。 当 运行 Java 程 序 时 ， 首 先 运行 JVM (Java 虚拟 机 ) ， 然 后 再 把 Java class 加 载 到 JVM 里 头 运行 ， 负 责 加 载 Java class 
的 这 部 分 就 叫 作 Class Loader。 

[11] Oracle 公 司 收购 SUN 公 司 后 整合 了 原 有 多 种 JVM 技 术 之 后 推出 的 一 种 JVM 实 现 技术 ， 相 对 以 往 的 JVM， 在 性 能 和 扩 

展 能 力 上 都 得 到 了 很 大 的 提升 ， 因 此 它 不 是 一 个 独立 产品 ， 可 以 理解 Sun (oracle) 实现 的 JVM 版 本 的 品牌 商标 。 

[12] 一 种 经 典 的 命令 模式 ，Master 和 Slave 之 间 通 过 相互 发 送 命令 (Command) 实现 交互 。 

[13] ZooKeeper 是 一 个 分 布 式 的 ， 开 放 源 码 的 分 布 式 应 用 程序 协调 服务 ， 是 Google 的 Chubby 一 个 开源 的 实现 ， 是 Hadoop 
和 Hbase 的 重要 组 件 。 它 是 一 个 为 分 布 式 应 用 提供 一 致 性 服务 的 软件 ， 提 供 的 功能 包括 : 配置 维护 、 名 字 服 务 、 分 布 式 

同步 、 组 服务 等 。 

[14] 软件 定义 网 络 (Software Defined Network, SDN) ， 是 Emulex 网 络 一 种 新 型 网 络 创新 架构 ， 是 网 络 虚拟 化 的 一 种 实 
现 方式 ， 其 核心 技术 OpenFlow 通 过 将 网 络 设备 控制 面 与 数据 面 分 离开 来 ， 从 而 实现 了 网 络 流量 的 灵活 控制 ， 使 网 络 作为 

管道 变 得 更 加 智能 。 


第 3 章 Java API 调 用 优化 建议 


某 一 年 ， 临 近 黄 河岸 是 有 一 片 村 庄 ， 为 了 防止 黄 患 ， 农 民 们 筑 起 
了 阐 峨 的 长 堤 。 一 天 有 个 老农 偶然 发 现 蚂蚁 窝 一 下 子 猛 增 了 许多 。 老 
农 心 想 这 些 蚂 蚊 富 究竟 会 不 会 影响 长 堤 的 安全 呢 ? 他 要 回 村 去 报告 ， 
路 上 遇见 了 他 的 儿子 。 老 农 的 儿子 听 了 不 以 为 然 说 : 借 坚 固 的 长 堤 ， 
还 害怕 几 只 小 小 蚂蚁 吗 ? 拉 老农 一 起 下 田 了 ， 当 天 晚上 风雨 交加 ， 黄 
河 里 的 水 猛 涨 起 来 ， 哆 哮 的 河水 从 蚂蚁 富 渗 透 出 来 ， 继 而 喷射 ， 终 于 
堤 决 人 淹 。 这 个 故事 对 应 的 典故 是 《韩非子 . 喻 老 》 一 文中 : “千丈 之 
JR, DUBEBNTTGE; 百 尺 之 室 ， 以 突 阶 之 炽 焚 。” 现 代 成 语 对 应 的 是 
“千里 之 堤 ， 演 于 蚁 穴 千 里 之 行 ， 始 于 足下 *。 

在 深入 了 解 Java 并 行 计 算 、JVM 性 能 优化 这 些 高 级 优化 策略 之 前 ， 
我 们 首先 要 会 写 代码 ， 如 果 连 基本 的 Java API 都 不 会 调用 ， 那 何 来 性 能 
优化 一 说 ， 又 何 来 进一步 的 针对 云 计算 、 虚 拟 机 这 些 新 兴 技术 的 Java 程 
序 性 能 优化 策略 。 本 章 不 会 从 API 的 基础 讲 起 ， 本 章 力求 让 读者 能 够 明 
白 底层 的 实现 、 最 优 的 代码 编写 方式 。 确 实 最 近 推出 的 JVM 越 来 越 
smart， 特 别 是 JIT 的 产生 ， 会 在 编译 的 时 候 帮助 我 们 整理 性 能 不 好 的 代 
码 ， 但 是 ， 我 个 人 觉得 只 有 自己 了 解 才 算 真正 懂 。 而 且 ， 这 样 也 可 以 
节省 编译 时 间 。 

本 章 主要 介绍 和 解决 以 下 问题 ， 这 些 也 是 性 能 优化 深入 学 习 之 前 
的 基础 知识 : 

u 如 何 对 数据 结构 相关 代码 进行 优化 。 

u 如 何 对 字符 串 相关 操作 代码 进行 优化 。 

如 何 对 引用 类 型 相关 代码 进行 优化 。 

和 如 何 采用 其 他 一 些 技巧 。 

四 如何 从 实际 范例 里 学 习 到 优化 方法 。 

u 为 后 续 章 节 做 好 编码 层面 知识 准备 。 


3.1 面向 对 象 及 基础 类 型 


3.1.1 采用 Clone () 方式 创建 对 象 


Java 语 言 里 面 的 所 有 类 都 默认 继承 自 java.lang.Object 类 ， 在 
java.lang.Object 类 里 面 有 一 个 clone () 方法 ，JDK API 的 说 明文 档 里 面 
解释 了 这 个 方法 会 返回 Object 对 象 的 一 个 拷贝 。 我 们 需要 说 明 两 点 : 一 
是 拷贝 对 象 返 回 的 是 一 个 新 对 象 ， 而 不 是 一 个 对 象 的 引用 地 址 ; 二 是 
拷贝 对 象 与 用 new 天 键 字 操作 符 返 回 的 新 对 象 的 区 别 是 ， 这 个 拷贝 已 经 
包含 了 一 些 原来 对 象 的 信息 ， 而 不 是 对 象 的 初始 信息 ， 即 每 次 拷贝 动 
作 不 是 一 个 针对 全 新 对 象 的 创建 。 

当 我 们 使 用 new 关 键 字 创 建 类 的 一 个 实例 时 ， 构 造 函 数 中 的 所 有 构 
造 轴 数 都 会 被 自动 调用 。 但 如 果 一 个 对 象 实现 了 Cloneable 接 口 ， 那 么 
我 们 可 以 通过 调用 它 的 clone () 方法 ， 注 意 ，clone O 方法 不 会 调用 
任何 构造 水 数 。 

代码 清单 3-1 所 示 是 工厂 模式 的 一 个 典型 实现 ， 工 三 模式 是 采用 工 
三 方法 代替 new 操 作 的 一 种 模式 ， 所 以 工厂 模式 的 作用 就 相当 于 创建 实 
例 对 象 的 new 操 作 符 。 


代码 清单 3-1 创建 新 对 象 
public static Credit getNewCredit () 
{ 
return new Credit () ;// 创 建 一 个 新 的 Credit 315. 
} 
如 果 我 们 采用 clone () 方法 的 方式 创建 对 象 ， 那 么 原 有 的 信息 可 


以 被 保留 ， 因 此 创建 速度 会 加 快 。 如 清单 3-2 所 示 ， 改 进 后 的 代码 使 用 
了 clone () 方法 。 


代码 清单 3-2 使 用 了 cone) AA 
private static Credit BaseCredit = new Credit(); 
public static Credit getNewCredit () 
{ 
return (Credit) BaseCredit.clone(); 


} 


3.1.2 避免 对 boolean 判 断 
Java 里 的 boolean 数 据 类 型 被 定义 为 存储 8 位 〈1 个 字 节 ) 的 数值 形 


式 ， 但 只 能 是 true 或 是 false。 

有 些 时 候 我 们 出 于 写 代码 的 习惯 ， 经 常 容易 导致 习惯 性 思维 ， 这 
里 指 的 习惯 性 思维 是 想 要 对 生成 的 数据 进行 判别 ， 这 样 感觉 可 以 在 该 
变量 进入 业务 逻辑 之 前 有 一 层 检查 、 判 定 。 对 于 大 多 数 的 数据 类 型 来 
说 ， 这 是 正确 的 做 法 ， 但 是 对 于 boolean 变 量 ， 我 们 应 该 尽量 避免 不 必 
要 的 等 于 判定 。 如 果 党 试 去 掉 boolean 与 true 的 比较 判断 代码 ， 大 体 上 来 
说 ， 我 们 会 有 两 个 好 处 。 

m 代码 执行 得 更 快 (生成 的 字 节 码 少 了 5 个 字 节 ) ; 

m 代码 整体 显得 更 加 干净 。 

例如 代码 清单 3-3 和 3-4 所 示 ， 我 们 针对 这 个 判定 进行 了 代码 解释 ， 
这 两 个 类 只 有 一 个 差距 ， 即 是 否 调 用 了 等 号 表达 式 进 行 了 一 致 性 判 
定 ， 如 代码 string.endswith ("a") ==trueo 


代码 清单 3-3 boolean 示例 1 
boolean method (string string) { 
return string.endswith ("a") == true;// 判 断 是 否 以 a 结尾 
} 


代码 清单 3-4 boolean 示例 2 
boolean method (string string) { 
return string.endswith ("a"); 


} 


3.1.3 多 用 条 件 操作 符 


我 们 在 编写 代码 的 过 程 中 很 喜欢 使 用 让 else 用 于 判定 ， 这 种 思维 来 
源 于 C 语 言 学 习 的 经 历 。 大 多 数 中 国学 生 都 是 从 谭 老 师 的 C 语 言 书籍 [1] 
了 解 计算 机 领域 知识 的 ， 我 们 在 高 级 语言 程序 设计 过 程 中 ， 如 果 有 可 
能 ， 尽 量 使 用 条 件 操作 符 " if (cond) return; else return; “这 样 的 顺 
序 判 断 结 构 ， 主 要 原因 还 是 因为 条 件 操 作 符 更 加 简捷 ， 代 码 看 起 来 会 
少 一 点 。 其 实 JVM 会 帮助 我 们 优化 代码 ， 但 是 个 人 感觉 能 省 就 省 吧 ， 
代码 过 多 让 人 看 着 不 爽 。 代 码 清单 3-5 和 3-6 所 示 是 示例 代码 ， 对 比 了 两 
者 的 区 别 。 


代码 清单 3-5 if Hl 1 

// 采 用 if-else 的 方式 

public int method (boolean isdone) { 
if 


isdone) { 
return 0; 


else { 


return 1; 


代码 清单 3-6 if 示 例 
public int method (boolean isdone) { 
return (isdone ? 0 : 1); 


} 


上 面 两 个 例子 ， 我 们 可 以 看 到 有 一 定 差 距 ， 代 码 行 数 缩短 了 50%。 
其 实现 代 JVM 已 经 在 编译 时 做 了 类 似 的 处 理 ， 但 是 从 代码 整洁 度 考 
虑 ， 我 觉得 还 是 推荐 多 采用 代码 清单 3-6 的 方式 实现 。 


3.1.4 静态 方法 替代 实例 方法 


在 Java 中 ， 使 用 static 关 键 字 描述 的 方法 是 静态 方法 。 与 静态 方法 
相 比 ， 实 例 方法 的 调用 需要 消耗 更 多 的 系统 资源 ， 这 是 因为 实例 方法 
需要 维护 一 张 类 似 虚 拟 遂 数 导 向 表 的 结构 ， 这 样 可 以 方便 地 实现 对 多 
态 的 支持 。 对 于 一 些 常 用 的 工具 类 方法 ， 我 们 没有 必要 对 其 进行 重 
载 ， 那 么 我 们 可 以 尝试 将 它们 声明 为 static， 即 静态 方法 ， 这 样 有 利于 
加 速 方法 的 调用 。 

如 代码 清单 3-7 所 示 ， 我 们 分 别 定 义 了 两 个 方法 ， 一 个 是 静态 方 
法 ， 一 个 是 实例 方法 ， 然 后 在 main 歼 p im 
法 ， 计 算 两 个 方法 的 调用 总 计时 间 。 


代码 清单 3-7 静态 方法 示例 
public static void staticMethod() { 
} 
// 实 例 方 法 
public void instanceMethod () { 


(Test 

public static void main(String[] args) { 
long start = System.currentTimeMillis(); 
| /循环 10 亿 次 ， 创 建 静态 方法 

for(int 1=0;1<1000000000; i++) { 

staticVSinstance.staticMethod(); 

} 


System.out.println(System.currentTimeMillis() - start); 


start = System.currentTimeMillis(); 
staticVSinstance sil = new staticVSinstance(); 
LIRR 10 亿 次 ， 创 建 实例 方法 
for(int j=0;j<1000000000;]j++) ( 
sil.instanceMethod(); 
} 
System.out.println(System.currentTimeMillis() - start); 


C E 


清单 3-7 代 码 中 申明 了 一 个 静态 方法 staticMethod () 和 一 个 实例 方 
法 instanceMethod () , 运行 程序 ， 统计 了 两 个 方法 调用 若干 次 后 的 耗 
时 ， 程 序 输出 如 下 ， 单 位 是 毫秒 ， 方 法 内 部 没有 实现 任何 代码 。 请 读 
者 注意 ， 由 于 机 器 差别 ， 所 以 运行 的 结果 可 能 也 会 有 所 不 同 。 


代码 清单 3-8 程序 运行 输出 


7133 764 


总 的 来 说 ， 静 态 方法 和 实例 方法 的 区 别 主要 体现 在 以 下 两 个 方 
面 。 

m 在 外 部 调用 静态 方法 时 ， 可 以 使 用 “类 名 .方法 名 “的 方式 ， 也 
可 以 使 用 “对 象 名 .方法 名 “的 方式 。 而 实例 方法 只 有 后 面 这 种 方式 。 
也 就 是 讽 ， 调 用 静态 方法 可 以 无 须 创 建 对 象 。 

m 静态 方法 在 访问 本 类 的 成 员 时 ， 只 允许 访问 静态 成 员 〈 即 静态 成 
员 变 量 和 静态 方法 ) ， 而 不 允许 访问 实例 成 员 变 量 和 实例 方法 ; 实例 
方法 则 无 此 限制 。 

从 上 面 的 例子 我 们 可 以 这 么 总 结 ， 如 果 你 没有 必要 去 访问 对 象 的 
外 部 ， 那 么 就 让 你 的 方法 成 为 静态 方法 。 静 态 方法 会 被 更 快 地 调用 ， 
因为 它 不 需要 一 个 虚拟 阔 数 导向 表 ， 该 表 用 来 告诉 你 如 何 区 分 方法 的 
性 质 ， 调 用 这 个 方法 不 会 改变 对 象 的 状态 。 


3.1.5 有 条 件 地 使 用 final 关 键 字 


在 Java 中 ，final 关 键 字 可 以 被 用 来 修饰 类 、 方 法 和 变量 (包括 成 员 

量 和 局 部 变量 ) 。 我 们 在 使 用 匿名 内 部 类 的 时 候 可 能 会 经 常用 到 final 
ien 例如 Java 中 的 String 类 就 是 一 个 final 类 。 

如 代码 清单 3-9 所 示 ， 由 于 final 关 键 子 会 后 诉 纲 译 器 ， 这 个 方法 不 
会 被 重 载 ， 所 以 我 们 可 以 让 访问 实例 内 变量 的 getter/setter 方 法 变 成 


“final”o 


代码 清单 3-9 非 fnal 类 
public void setsize (int size) { 
size = size; 
} 


private int size; 


代码 清单 3-10 final 类 
/ /告诉 编译 器 该 方法 不 会 被 重 载 
final public void setsize (int size) ( 
Size = size; 
} 


private int size; 


总 的 来 说 ， 使 用 final 方 法 的 原因 有 两 个 [2]。 第 1 个 原因 是 把 方法 锁 
定 ， 以 防 任何 继承 类 修改 它 的 含义 。 第 2 个 原因 是 提高 效率 。 在 早期 的 
Java 实 现 版 本 中 ， 会 将 final 方 法 转 为 内 能 调用 。 但 是 如 果 方 法 过 于 庞 
大 ， 可 能 看 不 到 内 骨 调 用 带 来 的 任何 性 能 提升 。JDK6 以 后 的 Java 版 本 
已 经 不 再 需要 使 用 final 方 法 进行 这 些 优化 了 。 


3.1.6 避免 不 需要 的 instanceof 操 作 


instanceof 关 键 字 是 Java 的 一 个 二 元 操作 符 ， 和 ==、> 、 < 是 属于 
同一 类 表达 式 。 由 于 instanceof 是 由 字母 组 成 的 ， 所 以 它 也 是 Java 的 保 
留 关 键 字 。instanceof 的 作用 是 测试 它 左 边 的 对 象 是 否 是 它 右边 的 类 的 
实例 ， 返 回 boolean 类 型 的 数据 ， 即 如 果 左 边 的 对 象 的 静态 类 型 等 于 右 
边 的 ， 我 们 使 用 的 instanceof 表 达 式 的 返回 值 会 返回 true。 


代码 清单 3-11 instanceof 示例 
void method (dog dog, faClass faclass) { 

dog d = dog; 

if (d instanceof faClass) // 这 里 永远 都 返回 true ， 
system.out.println("dog is a faClass ") 

faClass faclass - faclass; 

if (faclass instanceof object) // always true. 
system.out.println("uiso is an object"); 


| 


上 述 代 码 里 面 对 dog 类 型 的 变量 都 做 了 判定 ， 由 于 已 经 确定 类 继 
承 自 基 类 ， 所 以 我 们 可 以 删除 不 需要 的 instanceof 操 作 。 当 然 ， 这 样 的 
操作 修改 还 是 需要 基于 实际 的 业务 逻辑 ， 有 些 时 候 为 了 保证 数据 准确 
性 、 安 全 性 ， 还 是 需要 层 层 检查 的 。 如 代码 清单 3-12 所 示 ， 代 码 可 以 被 
精简 成 这 样 。 


代码 清单 3-12 instanceof 示例 
void method () { 
dog d; 
system.out.println ("dog is an faclass"); 
system.out.println ("uiso is an faclass"); 


} 


另外 ， 绝 大 多 数 情况 下 都 不 推荐 使 用 instanceof 方 法 ， 还 是 好 好 利 
用 多 态 特性 吧 ， 这 是 面向 对 象 的 基本 功能 。 


3.1.7 避免 子 类 中 存在 父 类 转换 
我 们 知道 在 Java 语 言 里 所 有 的 类 都 是 直接 或 者 间接 继承 目 Object 


类 。 我 们 可 以 说 ，Object 类 是 所 有 Java 类 的 祖先 ， 因 此 每 个 类 都 使 用 
Object 作 为 超 类 ， 所 有 对 象 《包括 数组 ) 都 实现 这 个 类 的 方法 。 在 不 明 


确 是 否 提 供 了 超 类 的 情况 下 ，Java 会 自动 把 Object 作为 被 定义 类 的 超 
aK 
a 


我 们 可 以 使 用 类 型 为 Object 的 变量 指向 任意 类 型 的 对 象 。 同 样 ， 所 
有 的 子 类 也 都 隐 含 的 “等 于 ”其 父 类 。 那 么 ， 程 序 代码 中 就 没有 必要 再 
把 子 类 对 象 转换 为 它 的 父 类 了 。 


代码 清单 3-13 ”避免 父 类 转换 示例 
class oriClass { 
string id - "unc"; 
} 
class dog extends oriClass{ 
void method () { 
dog dog = new dog(); 
oriClass animal = (oriClass)dog; // 已 经 确定 继承 自 oriClass 类 了 ， 因 此 没有 必要 再 转 
ARA 


object o = (object) dog; 


代码 清单 3-14 避免 父 类 转换 示例 
class dog extends oriClass { 
/ /去掉 了 转换 父 类 操作 
void method () { 
dog dog = new dog(); 
unc animal - dog; 


object o = dog; 


3.1.8 建议 多 使 用 局 部 变量 


调用 方法 时 传递 的 参数 以 及 在 调用 中 创建 的 临时 变量 都 被 保存 在 
栈 (Stck) 里 面 ， 因 此 读 写 速度 较 快 。 其 他 变量 ， 例 如 静态 变量 、 实 
例 变量 ， 它 们 都 在 堆 (heap) 中 被 创建 ， 也 被 保留 在 那里 ， 所 以 读 写 
相对 于 保存 在 栈 里 面 的 数据 来 说 ， 它 的 速度 较 慢 。 

Java 类 的 成 员 变量 有 两 种 ， 一 种 是 被 static 关 键 字 修饰 的 变量 ， 叫 
类 变量 或 者 静态 变量 ， 另 一 种 没有 static 修 饰 ， 称 为 实例 变量 。 在 语法 
定义 上 的 区 别 ， 静 态 变量 前 要 加 static 关 键 字 ， 而 实例 变量 前 则 不 加 。 

静态 变量 (类 变量 ) 被 所 有 对 象 共有 ， 如 果 其 中 一 个 对 象 将 它 的 
值 改变 ， 那 么 其 他 对 象 得 到 的 就 是 改变 后 的 结果 。 实 例 变量 属于 对 象 
私有 ， 如 果 某 一 个 对 象 将 其 值 改变 ， 也 不 会 影响 到 其 他 对 象 。 此 外 ， 
静态 变量 和 实例 变量 都 属 全 局 变量 。 

程序 运行 过 程 当 中 ， 实 例 变量 属于 某 个 对 象 的 属性 ， 必 须 创建 实 
例 对 象 ， 其 中 的 实例 变量 才 会 被 分 配 空间 ， 才 能 使 用 这 个 实例 变量 。 
静态 变量 不 属于 某 个 实例 对 象 ， 而 是 属于 类 ， 所 以 也 称 为 类 变量 ， 只 
要 程序 加 载 了 类 的 字 节 码 ， 不 用 创建 任何 实例 对 象 ， 静 态 变量 就 会 被 
分 配 空间 ， 静 态 变量 就 可 以 被 使 用 了 。 总 之 ， 实 例 变量 必须 创建 对 象 
后 才 可 以 通过 这 个 对 象 来 使 用 ， 静 态 变量 则 可 以 直接 使 用 类 名 来 引 
用 。 

代码 3-15 演 示 了 分 别 创建 100 万 次 实例 变量 和 静态 变量 所 消耗 的 时 
间 ， 从 测试 结果 来 看 ， 使 用 局 部 变量 和 静态 变量 的 操作 时 间 对 比较 为 


明显 。 


代码 清单 3-15 局 部 变量 和 静态 变量 之 间 的 对 比 测试 
public class variableCompare { 
public static int b = 0; 
public static void main(String[] args) { 
int a = 0; 
long starttime = System.currentTimeMillis(); 
for(int 1=0;1<1000000;1++) { 
att; 1/ 在 函数 体内 定义 局 部 变量 
} 
System.out.println(System.currentTimeMillis() - starttime); 
starttime = System.currentTimeMillis(); 
for(int i=0;i<1000000;i++){ 
bir; 1/ 在 函数 体内 定义 局 部 变量 
} 
System.out.println(System.currentTimeMillis() - starttime); 
} 
} 


以 上 两 段 代 码 的 运行 时 间 分 别 为 Oo 和 15， 单 位 是 蝇 秒 。 由 此 结果 可 
见 ， 局 部 变量 的 访问 速度 远 远 高 于 类 的 成 员 变 量 。 


3.1.9 运算 效率 最 高 的 方式 一 位 运算 


在 Java 语 言 中 的 所 有 运算 中 ， 位 运算 是 最 为 高 效 的 。 位 运算 表达 式 
由 操作 数 和 位 运算 符 组 成 ， 实 现 对 整数 类 型 的 二 进 制 数 进行 位 运算 。 
位 运算 符 可 以 分 为 逻辑 运算 符 (包括 ~~、&&、| 和 人 ^) 及 移 位 运算 符 OE 
括 >>、<< 和 > >>) o 因此 ， 可 以 尝试 使 用 位 运算 方式 代替 部 分 
算术 运算 ， 来 提高 系统 的 运行 速度 。 最 典型 示例 的 就 是 对 于 整数 的 乘 
除 运算 优化 。 


代码 清单 3-16 实 现 了 位 运算 与 算术 运算 的 对 比 ， 两 个 运算 方式 输出 
的 结果 是 一 样 的 ， 但 是 耗 时 差距 ; 达到 了 8 倍 。 


代码 清单 3-16 位 运算 与 算术 运算 对 比试 验 


public class yunsuanClass { 
public static void main(String args[]) { 
long start = System.currentTimeMillis(); 
long a=1000; 
// 执 行 1000 万 次 算术 运算 
for(int i=0;1<10000000;it+) ( 
a*-2; 
a/=2; 
} 
System.out.println (a); 
System.out.println(System.currentTimeMillis() - start); 
start = System.currentTimeMillis(); 
// 执 行 1000 万 次 位 运算 
for(int i20;1«10000000; i44)! 
a<<=1; 
a>>=1; 
} 
System.out.println (a); 
System.out.println(System.currentTimeMillis() - start); 
} 
} 


两 段 代码 执行 了 完全 相同 的 功能 ， 在 每 次 循环 中 ， 冯 整数 1000 乘 以 
ie E 第 2 个 循环 耗 时 63， 单 位 是 毫秒 
MS) o 

我 们 的 程序 内 部 进行 位 运算 时 ， 需 要 注意 以 下 几 点 。 

四 > > > 和 > > 的 区 别 是 : 在 执行 运算 时 ， > > > 运算 符 的 操作 数 
高 位 补 0， 而 > > 运算 符 的 操作 数 高 位 移入 原来 高 位 的 值 。 

e 右 移 一 位 相当 于 除 以 2， 左 移 一 位 (在 不 溢出 的 情况 下 ) 相当 于 
乘 以 2; 移 位 运算 速度 高 于 乘除 运算 。 


a 若 进 行 位 逻辑 运算 的 两 个 操作 数 的 数据 长 度 不 相同 ， 则 返回 值 应 
该 是 数据 长 度 较 长 的 数据 类 型 。 

m 按 位 异 或 可 以 不 使 用 临时 变量 完成 两 个 值 的 交换 ， 也 可 以 使 某 个 
整 型 数 的 特定 位 的 值 翻转 。 

m 按 位 与 运算 可 以 用 来 屏 散 特定 的 位 ， 也 可 以 用 来 取 某 个 数 型 数 中 
某 些 特定 的 位 。 

m 按 位 或 运算 可 以 用 来 对 某 个 整 型 数 的 特定 位 的 值 置 1。 

个 人 建议 ， 由 于 移 位 操作 需要 一 定 的 底层 编程 技术 能 力 ， 所 以 对 
于 刚 开始 接触 程序 设计 的 读者 来 说 ， 除 非 是 在 一 个 非常 大 的 循环 内 ， 
性 能 因素 至 关 重 要 ， 而 且 你 很 清楚 你 自己 在 做 什么 ， 才 建议 使 用 这 种 
方法 ， 否 则 提高 性 能 所 带 来 的 程序 易 读 性 的 降低 就 不 划算 了 。 


3.1.10 用 一 维 数组 代 蔡 二 维 数组 


JDK 很 多 类 库 是 采用 数组 方式 实现 的 数据 存储 ， 比 如 ArrayList、 
Vector 等 ， 数 组 的 优点 是 随机 访问 性 能 非常 好 。 

一 维 数 组 和 二 维 数组 的 访问 速度 不 一 样 ， 二 维 数组 的 访问 速度 要 
优 于 一 维 数组 ， 但 是 ， 二 维 数组 比 一 维 数组 占用 更 多 的 内 存 空 间 ， 大 
概 是 10 倍 左右 。 在 性 能 敏感 的 系统 中 要 使 用 二 维 数 组 ， 如 果 内 存 不 
足 ， 尽 量 将 二 维 数组 转化 为 一 维 数 组 再 进行 处 理 ， 以 节省 内 存 空 间 。 

如 代码 清单 3-17 所 示 ， 我 们 演示 了 一 维 数组 和 二 维 数组 比较 的 示例 
程序 。 


代码 清单 3-17 一 维 数组 和 二 维 数组 对 比 
public class arrayTest { 
public static void main(String[] args) { 
long start = System.currentTimeMillis(); 
int[] arraySingle = new int[1000000]; 
int chk = 0; 
// 构 建 1 亿 个 数组 元 素 ， 并 赋值 
for(int i=0;1<100;it+) { 
for(int j=0;}<arraySingle. length; j++) { 
arraySingle[j] = j; 


} 
[Èh 1 亿 个 数组 元 素 ， 并 赋值 给 局 部 变量 
for(int i=0;1<100;i++) { 
for(int j=0;}<arraySingle.length;jt+) { 
chk = arraySingle[j]; 


} 


System.out.println(System.currentTimeMillis() - start); 


start = System.currentTimeMillis(); 
int[][] arrayDouble = new int[1000] [1000]; 
chk = 0; 
// 构 建 对 应 于 1 亿 个 一 维 数组 的 二 维 数 组 
for(int i-0;i1«100;i*4)( 
for(int j=0;j<arrayDouble.length; j++) { 
for(int k=0;k<arrayDouble[0].length; k++) { 
arrayDouble [i] [j]=}; 


} 
/ /遍历 这 些 二 维 数组 
for(int i=0;i<100;i++){ 
for(int j=0;j<arrayDouble.length;j++) { 


for(int k-0;k«arrayDouble[0].length;k--*)( 
chk = arrayDouble[i] [j]; 


} 
System.out.println(System.currentTimeMillis() - start); 


start = System.currentTimeMillis(); 
arraySingle - new int[1000000]; 
int arraySingleSize - arraySingle.length; 
chk = 0; 
// 遍 历 一 维 数组 
for(int i=0;1i<100;i++) { 
for(int j=0;j<arraySingleSize; j++) { 
arraySingle[j] = j; 


} 
for(int i1=0;1<100;i++) { 
for(int j=0;j<arraySingleSize; j++) { 


chk = arraySingle[j]; 


} 


System.out.println(System.currentTimeMillis() - start); 


Start = System.currentTimeMillis(); 
arrayDouble - new int[1000][1000]; 
int arrayDoubleSize - arrayDouble.length; 
int firstSize = arrayDouble[0].length; 
chk = 0; 
// 遍 历 二 维 数组 
for(int i=0;i<100;i++) { 

for(int j=0;j<arrayDoubleSize; j++) { 

for(int k=0;k<firstSize; k++) { 
arrayDouble[i] [j]=j; 


} 
for(int i=0;i<100;i++) { 
for(int j=0;j<arrayDoubleSize; j++) { 
for(int k=0;k<firstSize; k++) { 
chk = arrayDouble[i][j]; 


} 
System.out.println(System.currentTimeMillis() - start); 


第 一 段 代码 操作 的 是 一 维 数 组 的 赋值 、 取 值 过 程 ， 第 二 段 代码 操 
作 的 是 二 维 数组 的 赋值 、 取 值 过 程 ， 第 三 段 代 码 是 一 维 数组 遍历 、 赋 
值 过 程 ， 第 四 段 代码 是 二 维 数组 的 遍历 、 赋 值 过 程 。 输 出 时 间 分 别 是 
374、312、297、266 毫 秒 。 从 3-17 所 示 代 码 的 运行 结果 来 看 ， 二 维 数 组 
的 速度 有 一 定 优势 ， 但 是 请 注意 ， 这 是 JVM 牺 牲 了 内 存 空 间 换 取 的 性 
能 ， 请 读者 自己 做 出 选择 。 


3.1.11 布尔 运算 代替 位 运算 


虽然 位 运算 的 速度 远 远 高 于 算术 运算 ， 但 是 在 条 件 判 断 时 ， 使 用 
位 运算 替代 布尔 运算 是 非常 非常 错误 的 选择 。 在 条 件 判断 时 ，Java 会 对 
布尔 运算 做 相当 充分 的 优化 。 假 设 有 表达 式 a、b、c 进 行 布尔 运算 
“a&&b&&c”， 根 据 逻 辑 与 的 特点 ， 只 要 在 整个 布尔 表达 式 中 有 一 项 返 
回 false， 整 个 表达 式 就 返回 false， 因 此 ， 当 表达 式 a 为 false 时 ， 该 表达 
式 将 立即 返回 false， 而 不 会 再 去 计算 表达 式 b 和 c。 若 此 时 ， 表 达 式 a、 
b、c 需 要 消耗 大 量 的 系统 资源 ， 这 种 处 理 方式 可 以 节省 这 些 计 算 资 
源 。 同 理 ， 当 计算 表达 式 “allbllc* 时 ， 只 要 a、b 或 c<，3 个 表达 式 其 中 任 
意 一 个 计算 结果 为 tue 时 ， 整 体 表达 式 立 即 返 回 true， 而 不 去 计算 剩余 
表达 式 。 简 单 地 说 ， 在 布尔 表达 式 的 计算 中 ， 只 要 表达 式 的 值 可 以 确 
定 ， 就 会 立即 返回 ， 而 跳 过 剩余 子 表达 式 的 计算 。 如 果 使 用 位 运算 
( 按 位 与 、 按 位 或 ) 代替 逻辑 与 和 逻辑 或 ， 虽 然 位 运算 本 身 没有 性 能 
问题 ， 但 是 位 运算 总 是 要 将 所 有 的 子 表达 式 全 部 计算 完成 后 ， 再 给 
最 终结 果 。 因 此 ， 从 这 个 角度 看 ， 使 用 位 运算 替代 布尔 运算 会 使 系统 
进行 很 多 无 效 计 算 。 代 码 清单 3-18 演 示 了 位 运算 与 布尔 运算 的 对 比 实 


JLo 


代码 清单 3-18 位 运算 与 布尔 运算 的 比较 
public class OperationCompare { 
public static void boolean0perate () { 
long start = System.currentTimeMillis(); 
boolean a - false; 
boolean b = true; 
int c = 0; 
IFARA AREER, REAL ON HAH TAT HOW RTE 
for(int 1=0;1<1000000;i++) { 
if (a&b&é"Test_123". contains ("123") ) { 


} 


System. out.println(System.currentTimeMillis() - start); 


public static void bitOperate() { 
long start = System.currentTimeMillis(); 
boolean a = false; 
boolean b = true; 
int g = Uy 
// 下 面 循环 开始 进行 布尔 运算 ， 只 计算 表达 式 a 即 可 满足 条 件 
for(int i120;1«1000000;i44)| 
if(a&&b&&"Test 123".contains ("123") ) { 


c=]; 


} 
System.out.println(System.currentTimeMillis() - start); 


} 


public static void main(String[] args) { 
OperationCompare.booleanOperate (); 


OperationCompare.bitOperate(); 


} 


上 面 的 示例 代码 运行 结果 显示 布尔 计算 大 大 优 于 位 运算 (位 运算 
用 了 63 毫 秒 ， 布 尔 运算 几乎 没有 耗 时 ) ， 但 是 ， 这 个 结果 不 能 说 明 位 
运算 比 逻 辑 运算 慢 ， 因 为 在 所 有 的 逻辑 与 运算 中 ， 都 省 略 了 表达 式 * 
Test 123 ".contains ("123") ”的 计算 ， 而 所 有 的 位 运算 都 没 能 省 略 
这 部 分 系统 开销 。 


3.1.12 提取 表达 式 优化 


在 大 部 分 情况 下 ， 由 于 计算 机 运算 单元 (CPU) 的 不 断 发 展 ， 我 
们 现在 用 的 CPU 大 多 是 多 核 的 ， 有 些 可 能 还 会 附带 GPU， 这 样 我 们 可 
以 把 图 像 计 算 、 效 据 挖掘 算法 这 类 需要 消耗 大 量 计算 资产 的 程序 放 到 
GPU 上 运行 ， 这 是 题 外 话 了 ， 不 多 展开 。 这 样 ， 我 们 知道 在 程序 高 速 
运行 过 程 当中 ， 人 少量 的 重复 代码 并 不 会 对 性 能 构成 太 大 的 威胁 ， 但 是 
如 果 你 希望 将 系统 性 能 发 挥 到 极致 ， 则 还 是 有 很 多 地 方 可 以 优化 的 。 
比如 代码 清单 3-19 所 示 的 代码 ， 我 们 通过 采用 局 部 变量 的 方式 ， 避 免 了 
重复 的 计算 ， 虽 然 计 算 量 相对 于 CPU 来 说 很 微小 ， 但 是 总 是 还 是 可 以 
节省 一 点 时 间 的 。 


代码 清单 3-19 提取 表达 式 实验 
public class duplicatedCode { 
public static void beforeTuning() { 


long start = System.currentTimeMillis(); 


double al = Math.random(); 

double a2 = Math.random(); 

double a3 = Math.random(); 

double a4 = Math.random(); 

double b1,b2; 

/ /开始 循环 运算 

for(int 1=0;1<10000000;1++) { 
bl = al*a2*a4/3*4*a3*a4; 
b2 = al*a2*a3/3*4*a3*a4; 


} 


System.out.println(System.currentTimeMillis() - start); 


public static void afterTuning()| 
long start = System.currentTimeMillis(); 
double al = Math.random(); 
double a2 = Math.random(); 
double a3 = Math.random(); 
double a4 = Math.random(); 
double combine,b1,b2; 


/ /计算 公式 被 移 到 了 外 面 
for(int 1=0;1<10000000;1i++) { 
combine = al*a2/3*4*a3*a4; 
bl = combine*a4; 
b2 = combine*a3; 
} 
System.out.println(System.currentTimeMillis() - start); 


} 


public static void main(String[] args) { 
duplicatedCode.beforeTuning(); 
duplicatedCode.afterTuning(); 


} 


两 段 代码 的 差别 是 提取 了 重复 的 攻势 ， 使 得 这 个 公式 的 每 次 循环 
计算 只 执行 一 次 。 分 别 耗 时 202ms 和 110ms， 可 见 ， 提 取 复 杂 的 重复 操 
作 是 相当 具有 意义 的 。 这 个 例子 告诉 我 们 ， 在 循环 体内 ， 如 果 能 够 提 
取 到 循环 体外 的 计算 公式 ， 最 好 提取 出 来 ， 尽 可 能 让 程序 少 做 重复 的 
计算 。 


3.1.13 不 要 总 是 使 用 取 反 操作 符 (! ) 


取 反 操作 符 (1) 表示 异 或 操作 ， 使 用 起 来 很 方便 ， 但 是 也 要 注 
意 的 是 ， 它 降低 了 程序 的 可 读 性 ， 所 以 建议 不 要 经 常 使 用 。 


代码 清单 3-20 ” 取 反 操作 符 示例 
boolean method (boolean a, boolean b) { 
if (!a) 
return !a; 
else 
return !b; 


} 


3.1.14 不 要 重复 初始 化 变量 


默认 情况 下 ， 调 用 类 的 构造 函数 时 ，Java 会 把 变量 初始 化 为 一 个 确 
定 的 值 ， 例 如 ， 所 有 的 对 象 被 设置 成 Null， 整 数 变量 设置 成 0，float 和 
double 变 量 设置 成 0.0， 逻 辑 值 设置 成 false。 当 一 个 类 从 另 一 个 类 派生 
时 ， 这 一 点 尤其 应 该 注意 ， 因 为 用 new 关 键 字 创建 一 个 对 象 时 ， 构 造 函 
数 链 中 的 所 有 构造 图 数 都 会 被 自动 调用 。 

这 里 需要 注意 ， 当 我 们 给 成 员 变量 设置 初始 值 ， 又 需要 调用 其 他 
方法 的 时 候 ， 最 好 放 在 一 个 方法 里 面 。 比 如 initXXX O 中 ， 因 为 直接 
调用 某 方法 赋值 可 能 会 因为 类 尚未 初始 化 而 抛 空 指针 异常 。 

此 外 ， 如 果 不 初始 化 变量 ， 那 么 当 我 们 直接 调用 变量 的 时 候 ， 系 
统 会 给 对 象 或 变量 随机 赋 一 个 值 ， 这 样 容易 产生 不 必要 的 错误 。 


3.1.15 变量 初始 化 过 程 思 考 


由 于 智能 化 的 GUI 工具 ， 例 如 Eclipse、IntelliIDEA 这 样 的 工具 存 
在 ， 所 以 程序 员 很 少 会 去 主动 思考 Java 程 序 对 于 成 员 变 量 的 声明 及 初始 
化 顺序 ， 一 般 都 是 按照 自己 的 习惯 方式 进行 编码 ， 如 果 出 错 了 GUI 工具 
也 会 自动 提醒 ， 点 一 下 左 侧 的 修复 按钮 就 会 自动 修复 代码 。 

我 们 思考 一 个 问题 ， 为 什么 抽象 类 不 能 用 final 关 键 字 声明 ?如 果 读 
者 看 过 问安 博士 的 《Java 与 模式 》 书 ， 那 么 可 能 已 经 知道 了 答案 ， 因 为 
一 个 类 一 旦 被 修饰 成 了 final， 那 么 意味 着 这 个 类 是 不 能 被 继承 的 ， 并 且 
Java 中 定义 抽象 类 不 能 被 实例 化 。 如 果 一 个 抽象 类 可 以 是 final 类 型 的 ， 
那么 这 个 类 就 不 能 被 继承 ， 也 不 能 被 实例 化 ， 那 么 它 也 就 没有 存在 的 


意义 了 。 即 从 语言 的 角度 来 讲 ， 一 个 类 既然 是 抽象 类 ， 那 么 它 就 是 为 
了 被 其 他 类 继承 ， 所 以 给 它 标识 为 final 是 没有 意义 的 。 

我 们 来 看 一 系列 的 示例 代码 ， 通 过 这 些 代码 可 以 帮助 读者 理解 成 
员 变 量 的 初始 化 过 程 。 

如 代码 清单 3-21 所 示 ， 我 们 首先 定义 局 部 变量 variableA 的 值 为 1， 
然后 申明 变量 ， 由 于 main 主 图 数 里 面 会 实例 化 类 varClass， 所 以 
variableA 会 被 赋值 为 1。 


代码 清单 3-21 普通 局 部 变量 
public class varClass { 
{ 


variableA = 1; 


private int variableA; 


public static void main(String[] args) { 
3-24Class testl - new 3-24Class (); 
System.out.println(testl.variableA); 

} 

} 


程序 运行 输出 为 1， 如 果 我 们 想 要 打印 出 variableA 的 值 ， 我 们 必须 
等 到 成 员 变量 被 申明 后 才能 这 么 做 ， 代 码 清 单 3-22 所 示 的 代码 ，GUI 工 
具 会 提醒 我 们 ，“cannot reference a field before it is defined”， 也 就 是 无 
法 在 申明 之 前 调用 它 的 引用 地 址 。 


代码 清单 3-22 普通 局 部 变量 尝试 输出 
public class errorClass 
{ 
variableA = 1; 


System. out println(variablea) ;// 这 一 行 会 抛 出 错误 ， 必 须 注释 后 才能 在 GUI 工具 里 面 运 行 这 个 类 
private final int variableA; 


public static void main(String[] args) { 

errorClass testl = new errorClass(); 
System.out.println(testl.variableA); 

} 

} 


如 果 把 variableA 申 明 为 final 呢 ? 如 代码 清单 3-23 所 示 。 


代码 清单 3.23 final 局 部 变量 
public class finalClass { 


{ 


variableA = 1; 


private final int variableA; 


public static void main(String[] args) { 
finalClass testl = new finalClass(); 


System.out.println(testl.variableA); 


} 


输出 依然 是 1， 但 是 如 果 我 们 尝试 对 final 关 键 字 申明 的 variableA 变 
量 赋值 ， 那 么 又 会 产生 错误 “The final field Class1.variableA cannot be 


assigned”， 即 既然 是 不 可 变 的 变量 ， 又 怎么 允许 在 申明 之 后 的 代码 块 
里 面 继 续 变 更 变量 值 呢 。 

如 果 我 们 对 3-22 代 码 稍 作 修 改 ， 定 义 private int variable=2， 程 序 的 
输出 会 变 成 2， 这 是 因为 代码 的 分 析 、 执 行 是 从 上 至 下 的 ， 实 质 上 我 们 
可 以 看 出 ，JVM 将 变量 variable 的 申明 和 赋值 分 为 了 两 个 步骤 ， 即 先 执 
行 申明 操作 ， 然 后 顺序 地 执行 第 1 步 赋 值 操 作 ， 即 赋值 为 1， 然 后 执行 
第 2 步 赋 值 操作 ， 赋 值 为 2， 这 样 最 终 类 实例 会 打印 出 第 2 个 值 ， 即 2。 

如 果 我 们 依然 相 打 印 出 1 呢 ? 我 们 可 以 通过 申明 变量 为 静态 变量 的 
方式 来 达到 这 样 的 目的 ， 如 代码 清单 3-24 所 示 。 


代码 清单 3-24 static 变量 
public class staticClass { 
//static 
{ 
variableA = 1; 


} 
private static int variableA = 2; 


public static void main(String[] args) { 
staticClass testl = new staticClass(); 


System. out.println(testl.variableA) ; 


} 


如 果 和 希望 输出 为 2， 那 么 可 以 释放 3-23 代 码 中 注释 的 针对 代码 块 的 
static 关 键 字 申明 ， 这 样 可 以 确保 程序 先 执行 静态 代码 块 ， 也 就 确保 了 
风 值 2 的 定义 被 后 续 执行 。 

这 一 个 小 节 讲 述 的 是 成 员 变 量 、 代 码 块 的 申明 过 程 、 执 行 顺 序 ， 
我 们 在 很 多 场景 下 可 能 不 会 去 思考 这 类 问题 ， 但 是 作者 觉得 还 是 有 必 
要 思考 的 ， 这 样 可 以 帮助 程序 员 理 清 思路 ， 也 许 ， 下 一 个 语言 是 由 你 
创造 的 呢 ? 


3.1.16 对 象 的 创建 、 访 问 过 程 


四 对 象 的 创建 

创建 一 个 对 象 通常 是 需要 new 关 键 字 ， 当 虚拟 机 遇 到 一 条 new 指 令 
时 ， 首 先 检 查 这 个 指令 的 参数 是 否 在 常量 池 中 定位 到 一 个 类 的 符号 引 
用 ， 并 且 检 查 这 个 符号 引用 代表 的 类 是 否 已 被 加 载 、 解 析 和 初始 化 
过 。 如 果 那 么 执行 相应 的 类 加 载 过 程 。 

类 加 载 检查 通过 后 ， 虚 拟 机 将 为 新 生 对 象 分 配 内 存 。 为 对 象 分 配 
空间 的 任务 等 同 于 把 一 块 确定 大 小 的 内 存 从 Java 堆 中 划分 出 来 。 分 配 的 
方式 有 两 种 ， 一 种 叫 指 针 碰 撞 ， 假 设 Java 扒 中 内 存 是 绝对 规整 的 ， 用 过 
的 和 空闲 的 内 存 各 在 一 边 ， 中 间 放 着 一 个 指针 作为 分 界 点 的 指示 器 ， 
分 配 内 存 就 是 把 那个 指针 向 空 内 空间 的 那 边 挪动 一 段 与 对 象 大 小 相等 
的 距离 。 另 一 种 叫 空 朵 列表 ， 如 果 Java 扒 中 的 内 存 不 是 规整 的 ， 虚 拟 机 
就 需要 维护 一 个 列表 ， 记 录 哪 个 内 存 块 是 可 用 的 ， 在 分 配 的 时 候 从 列 
表 中 找到 一 块 足够 大 的 空间 划分 给 对 象 实例 ， 并 更 新 列表 上 的 记录 。 
采用 哪 种 分 配方 式 是 由 Java 堆 是 否 规整 决定 的 ， 而 Java 堆 是 否 规 整 是 由 
所 采用 的 垃圾 收集 器 是 否 带 有 压缩 整理 功能 决定 的 。 另 外 一 个 需要 考 
虑 的 问题 就 是 对 象 创建 时 的 线程 安全 问题 ， 有 两 种 解决 方案 : 一 是 对 
分 配 内 存 空间 的 动作 进行 同步 处 理 ; 另 一 种 是 把 内 存 分 配 的 动作 按照 
线程 划分 在 不 同 的 空间 之 中 进行 ， 即 每 个 线程 在 Java 堆 中 预先 分 配 一 小 
RAF (TLAB) ， 哪 个 线程 要 分 配 内 存 就 在 哪个 线程 的 TLAB 上 分 
配 ， 只 有 TLAB 用 完 并 分 配 新 的 TLAB 时 才 需 要 同步 锁定 。 

内 存 分 配 完成 后 ， 虚 拟 机 需要 将 分 配 到 的 内 存 空间 初始 化 为 零 
值 。 这 一 步 操作 保证 了 对 象 的 实例 字段 在 Java 代 码 中 可 以 不 赋 初 始 值 就 
可 以 直接 使 用 。 接 下 来 虚拟 机 要 对 对 象 进行 必要 的 设置 ， 例 如 这 个 对 
象 是 哪个 类 的 实例 、 如 何 才能 找到 类 的 元 数据 信息 等 ， 这 些 信息 存放 
在 对 象 的 对 象 头 中 。 

上 面 的 工作 都 完成 以 后 ， 从 虚拟 机 的 角度 来 看 一 个 新 的 对 象 已 经 
产生 了 。 但 是 从 Java 程 序 的 角度 ， 还 需要 执行 init 方 法 ， 把 对 象 按照 程 
序 员 的 意愿 进行 初始 化 ， 这 样 一 个 真正 可 用 的 对 象 才 算 完全 产生 出 
Ko 
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在 HotSpot 虚 拟 机 中 ， 对 象 在 内 存 中 存储 的 布局 可 分 为 三 个 部 分 ， 
即 对 线头 、 实 例 数 据 和 对 齐 填充 。 

对 象 头 包括 两 个 部 分 : 第 一 部 分 用 于 存储 对 象 自身 的 运行 时 数 
据 ， 如 哈 希 码 、GC 分 代 年 龄 、 线 程 所 持 有 的 锁 等 。 官 方 称 之 为 “Mark 
Word”。 第 二 个 部 分 为 是 类 型 指针 ， 即 对 象 指 向 它 的 类 元 数据 的 指针 ， 
虚拟 机 通过 这 个 指针 来 确定 这 个 对 象 是 哪个 类 的 实例 。 

实例 数据 是 对 象 真 正 存 储 的 有 效 信息 ， 也 是 程序 代码 中 所 定义 的 
各 种 类 型 的 字段 内 容 。 

对 章 填充 并 不 是 必然 存在 的 ， 仅 仅 起 着 占 位 符 的 作用 。Hotpot VM 
要 求 对 象 起 始 地 址 必须 是 8 字 节 的 整数 倍 ， 对 象 头 部 分 正好 是 8 字 节 的 
倍数 ， 所 以 当 实例 数据 部 分 没有 对 齐 时 ， 需 要 通过 对 齐 填 充 来 对 齐 。 

四 对 象 的 访问 定位 

Java 程 序 通过 栈 上 的 reference 数 据 来 操作 堆 上 的 具体 对 象 。 主 要 的 
访问 方式 有 使 用 句柄 和 直接 指针 两 种 : 

m 句柄 : Java 扒 将 会 划 出 一 块 内 存 来 作为 句柄 地 ，5 引 用 中 存储 的 就 
是 对 象 的 句柄 地 址 ， 而 句柄 中 包含 了 对 象 实 例 数 据 与 类 型 数据 各 自 的 
具体 地 址 信息 。 

m 直接 指针 : Java 扒 对 象 的 布局 要 考虑 如 何 放置 访问 类 型 数据 的 相 
关 信 息 ，5 引 用 中 存储 的 就 是 对 象 地 址 。 

两 个 方式 各 有 优点 ， 使 用 句柄 最 大 的 好 处 是 引用 中 存储 的 是 稳定 
的 句柄 地 址 ， 对 象 被 移动 时 只 会 改变 句柄 中 实例 的 地 址 ， 引 用 不 需要 
修改 、 使 用 直接 指针 访问 的 好 处 是 速度 更 快 ， 它 节省 了 一 次 指针 定位 
的 时 间 开 销 。 


3.1.17 在 switch 语 句 中 使 用 字符 串 


对 于 switch 语 句 ， 开 发 人 员 并 不 阳 生 。 大 部 分 编程 语言 中 都 有 类 似 
的 语法 结构 ， 用 来 根据 某 个 表达 式 的 值 选择 要 执行 的 语句 块 。 对 于 
switch 语 句 中 的 条 件 表达 式 类 型 ， 不 同 编 程 语言 所 提供 的 支持 是 不 一 样 
的 。 对 于 Java 语 言 来 说 ， 在 Java 7 之 前 ，switch 语 句 中 的 条 件 表达 式 的 
类 型 只 能 是 与 整数 类 型 兼容 的 类 型 ， 包 括 基 本 类 型 char、byte、short 和 
int， 与 这 些 基本 类 型 对 应 的 封装 类 Character、Byte、Short 和 Integer， 还 


有 枚 举 类 型 。 这 样 的 限制 降低 了 语言 的 灵活 性 ， 使 开发 人 员 在 需要 根 
据 其 他 类 型 的 表达 式 来 进行 条 件 选 择 时 ， 不 得 不 增加 额外 的 代码 来 绕 
过 这 个 限制 。 为 此 ，Java 7 放宽 了 这 个 限制 ， 额 外 增加 了 一 种 可 以 在 
switch 语 句 中 使 用 的 表达 式 类 型 ， 那 就 是 很 常见 的 字符 串 ， 即 String 类 
型 。 

Java 7 新 特性 并 没有 改变 switch 的 语法 含义 ， 只 是 多 了 一 种 开发 人 
员 可 以 选择 的 条 件 判断 的 数据 类 型 。 但 是 这 个 简单 的 新 特性 却 带 来 了 
重大 的 影响 ， 因 为 根据 字符 串 进行 条 件 判 断 在 开发 中 是 很 常见 的 。 

考虑 这 样 一 个 应 用 场景 ， 在 程序 中 需要 根据 用 户 的 性 别 来 生成 合 
适 的 称谓 。 判 断 条 件 的 类 型 可 以 是 字符 串 ， 不 过 这 在 Java 7 之 前 的 
switch 语 句 中 是 行 不 通 的， 之 前 只 能 添加 额外 的 代码 先 将 字符 串 转 换 成 
整数 类 型 。 而 在 Java 7 中 就 可 以 根据 字符 串 进 行 条 件 判 断 ， 代 码 如 清单 
3-25 所 示 。 


代码 清单 3-25 Switch 新 特性 
public class Title { 
public String generate (String name,String gender) | 
String title = ""; 
switch(gender) { 
case "A": 
title = name + "44"; 
break; 
case "X": 
title = name + "K+"; 
break; 
default: 
title - name; 
} 


return title; 


在 switch 语 句 中 ， 表 达 式 的 值 不 能 是 null， 否 则 会 在 运行 时 抛 出 
NullPointException。 在 case 子 句 中 也 不 能 使 用 Null， 否 则 会 出 现 编译 错 
误 o 

根据 siwtch 语 句 的 语法 要 求 ， 其 case 子 句 的 值 是 不 能 重复 的 。 这 个 
要 求 对 字符 串 类 型 的 条 件 表 达 式 同样 适用 。 不 过 对 于 字符 串 来 说 ， 这 
种 重复 值得 检查 还 有 一 个 特殊 之 处 ， 那 就 是 Java 代 码 中 的 字符 串 可 以 包 
含 Unicode 转 义 字 符 。 重 复 值 的 检查 是 在 Java 编 译 器 对 Java 源 代码 进行 
相关 的 词法 转换 之 后 才 进 行 的 。 这 个 词法 转换 过 程 中 包括 了 对 Unicode 
转 义 字符 的 处 理 。 也 就 是 说 ， 有 些 case 子 句 的 值 虽然 在 源 代码 中 看 起 来 
是 不 同 的 ， 但 是 经 词法 转换 后 是 一 样 的 ， 这 就 会 造成 编译 错误 。 如 下 
面 的 代码 是 无 法 通过 编译 的 。 这 是 因为 其 中 的 switch 语 句 中 的 两 个 case 
字句 所 使 用 的 值 在 经 过 词法 转换 之 后 会 变 成 一 样 的。 


代码 清单 3-26 错误 的 switch 
public class Title { 


public String generate (String name,String gender) { 
String title - "" 
switch (gender) { 
case "Jj": 
title = name + "先生 "， 
break; 
case "\u7537": 
title = name + "kt"; 
break; 
default: 
title = name; 
} 


return title; 


} 


代码 清单 3-26 所 示人 代码 ，eclipse 会 提示 错误 : Duplicate caseo 


通过 以 上 代码 的 演示 ， 大 家 应 该 清楚 了 新 特性 的 作用 。 实 际 上 ， 
这 个 新 特性 是 在 编译 器 这 个 层次 上 实现 的 。 而 在 Java 虚 拟 机 和 字 节 代码 
这 个 层次 上 ， 还 是 只 支持 在 switch 语 句 中 使 用 与 整数 类 型 兼容 的 类 型 。 
这 么 做 的 目的 是 为 了 减少 这 个 特性 所 影响 的 范围 ， 以 降低 实现 的 代 
价 。 在 编译 器 层次 实现 的 含义 是 ， 虽 然 开 发 人 员 在 Java 源 代码 的 switch 
语句 中 使 用 了 字符 串 类 型 ， 但 是 在 编译 的 过 程 中 ， 编 译 器 会 根据 源 代 
码 的 含义 来 进行 转换 ， 将 字符 串 类 型 转换 成 与 整数 类 型 兼容 的 格式 。 
不 同 的 Java 编 译 器 可 能 采用 不 同 的 方式 来 完成 这 个 转换 ， 并 采用 不 同 的 
优化 策略 。 举 个 例子 ， 如 果 switch 语 句 中 只 包含 一 个 case 子 句 ， 那 么 可 
以 简单 地 将 其 转换 成 一 个 让 语句 。 如 果 switch 语 句 中 包含 一 个 case 子 名 
和 一 个 default 子 句 ， 那 么 可 以 将 其 转换 成 一 个 if-else 语 句 。 而 对 于 复杂 
的 情况 ， 即 switch 语 句 中 包含 多 个 case 子 句 的 情况 ， 也 可 以 转换 成 Java 7 
之 前 的 switch 语 句 ， 只 不 过 使 用 字符 串 的 哈 希 值 作 为 switch 语 句 的 表达 
式 的 值 。 

为 了 探究 OpenJDK 中 的 Java 编 译 器 使 用 的 是 什么 样 的 转换 方式 ， 需 
要 一 个 名 为 JAD 的 工具 。 这 个 工具 可 以 把 Java 的 类 文件 反 编 译 成 Java 的 
源 代 码 。 在 对 编译 生成 Title 类 的 class 文 件 使 用 了 JAD 之 后 ， 所 得 到 的 内 
容 如 清单 3-27 所 示 。 


代码 清单 3-27 编译 后 的 类 代码 
public class Title 
{ 
public String generate (String name,String gender) 
{ 
String title = ""; 
String s = gender; 
byte byte0 = -1; 
switch (s. hashCode () ) 
{ 
case 30007: 
if (s.equals(“\u7537”) ) 
byte0 = 0; 
break; 
case 22899: 
if (s.equals (“\u5973”) ) 
byte0 = 0; 
break; 
} 
switch (byte0) 
{ 
case 0://'\0! 
title = (new StringBuilder ()) .append(name) .append(“\u5148\u751F”) ,toString () ; 
break; 
case 1://'\001' 
title = (new StringBuilder ()) .append(name) .append(“\u5973\u58EB”) ,toString () ; 
break; 
default: 
title = name; 
break; 
} 
return title; 
} 
} 


从 上 面 的 代码 可 以 看 出 ， 原 来 用 在 switch 语 句 中 的 字符 串 被 替换 成 
了 对 应 的 哈 希 值 ， 而 case 子 句 的 值 也 被 换 成 了 原来 字符 串 常 量 的 哈 希 
值 。 经 过 这 样 的 转换 ，Java 虚 拟 机 所 看 到 的 仍然 是 与 整数 类 型 兼容 的 类 
型 。 在 这 里 值得 注意 的 是 ， 在 case 子 句 对 应 的 语句 块 中 仍然 需要 使 用 
String 的 equals 方 法 来 进行 字符 串 比较 。 这 是 因为 哈 希 图 数 在 映射 的 时 
候 可 能 存在 冲突 ， 多 个 字符 串 的 哈 希 值 可 能 是 一 样 的 。 进 行 字符 串 比 
较 是 为 了 保证 转换 之 后 的 代码 逻辑 与 之 前 完全 一 样 。 

Java 7 引入 的 这 个 新 特性 虽然 为 开发 人 员 提 供 了 方便 ， 但 是 比较 容 
易 被 误 用 ， 造 成 代码 的 可 维护 性 差 的 问题 。 提 到 这 一 点 就 必须 要 说 一 
下 Java SE 5.0 中 引入 的 枚 举 类 型 。switch 语 句 的 一 个 典型 的 应 用 就 是 在 
多 个 枚 举 值 之 间 进 行 选择 。 在 Java SE 5.0 之 前 ， 一 般 的 做 法 是 使 用 一 个 
整数 来 为 这 些 枚 举 值 编号 ， 比 如 0 表示 “ 男 ”，1 表 示 “ 女 ”。 在 switch 语 名 
中 使 用 这 个 整数 编码 来 进行 判断 。 这 种 做 法 的 蜂 端 有 很 多 ， 比 如 不 是 
类 型 安全 的 、 没 有 名 称 空间 、 可 维护 性 差 和 不 够 直观 等 。Joshua Bloch 
最 早 在 他 的 “Effective Java” 一 书 中 提出 了 一 种 类 型 安全 的 枚 举 类 型 的 实 
现 方式 。 这 种 方式 在 J2SE 5.0 中 被 引入 到 标准 库 ， 就 是 现在 的 enum 天 键 
字 。 

Java 语 言 中 的 枚 举 类 型 的 最 大 优势 在 于 它 是 一 个 完整 的 Java 类 ， 除 
了 定义 其 中 包含 的 枚 举 值 之 外 ， 还 可 以 包含 任意 的 方法 和 域 ， 以 及 实 
现任 意 的 接口 。 这 使 得 枚 举 类 型 可 以 很 好 地 与 其 他 Java 类 进行 交互 。 在 
涉及 多 个 枚 举 值 的 情况 下 ， 都 应 该 优先 使 用 枚 举 类 型 。 

在 Java 7 之 前 ， 也 就 是 switch 语 句 还 不 支持 使 用 字符 串 表 达 式 类 型 
时 ， 如 果 要 枚 举 的 值 本 身 都 是 字符 串 ， 使 用 枚 举 类 型 是 唯一 的 选择 。 
而 在 Java 7 中 ， 由 于 switch 语 句 增加 了 对 字符 串 条 件 表达 式 的 支持 ， 一 
些 开 发 人 员 会 选择 放弃 枚 举 类 型 而 直接 在 case 子 句 中 用 字符 串 常 量 来 列 
出 各 个 枚 举 值 。 这 种 方式 虽然 简单 和 直接 ， 但 是 会 带 来 维护 上 的 麻 
烦 ， 尤 其 是 这 样 的 switch 语 句 在 程序 的 多 个 地 方 出 现 的 时 候 ， 在 程序 中 
多 次 出 现 字 符 串 常量 总 是 一 个 不 好 的 现象 ， 而 使 用 枚 举 类 型 就 可 以 避 
免 这 种 情况 。 


3.1.18 数值 字面 量 的 改进 


在 编程 语言 中 ， 字 面 量 (literal) 指 的 是 在 源 代 码 中 直接 表示 的 一 
个 固定 的 值 。 绝 大 部 分 编程 语言 都 支持 在 源 代 码 中 使 用 基本 类 型 字面 
量 ， 包 括 整 数 、 浮 点 数 、 字 符 串 和 布尔 值 等 。 少 数 编程 语 言 支 持 复杂 
类 型 的 字面 量 ， 如 数组 和 对 象 等 。Java 语 言 只 支持 基本 类 型 的 字面 量 。 
Java 7 中 对 数值 类 型 字面 量 进行 了 增强 ， 包 括 对 整数 和 浮 点 数字 面 量 的 
增强 。 

在 Java 源 代码 中 使 用 整数 字面 量 的 时 候 ， 可 以 指定 所 使 用 的 进 制 |。 
在 Java 7 之 前 ， 所 支持 的 进 制 包括 十 进 制 、 八 进 制 和 十 六 进 制 。 十 进 制 
是 默认 使 用 的 进 制 。 八 进 制 是 用 在 整数 字面 量 之 前 添加 “0” 来 表示 的 ， 
而 十 六 进 制 则 是 用 在 整数 字面 量 之 前 添加 “0x”* 或 “0X” 来 表示 的 。Java 7 
中 增加 了 一 种 可 以 在 字面 量 中 使 用 的 进 制 ， 即 二 进 制 。 二 进 制 整数 字 
面 量 是 通过 在 数字 前 面 添加 “0b”* 或 “0B” 来 表示 的 。 


代码 清单 3-28 二 进 制 示例 1 
import static java.lang.System.out; 
public class BinaryIntegralliteral { 
public void display () { 
out.println (0b001001) ;// 输 出 9 
out .println (0B001110) ;// 输 出 14 
} 
public static void main(String[] args) { 
BinaryIntegralliteral b = new BinaryIntegralLiteral (); 


b.display(); 


} 


这 种 新 的 二 进 制 字面 量 的 表示 方式 使 得 在 源 代 码 中 使 用 二 进 制 数 
据 变 得 更 加 简单 ， 不 再 需要 先 手 动 将 数据 转换 成 对 应 的 八 /十 /十 六 进 制 
的 数值 。 

如 果 Java 源 代码 中 有 一 个 很 长 的 数值 字面 量 ， 开 发 人 员 在 阅读 这 段 
代码 时 需要 很 费力 地 分 辨 数字 的 位 数 ， 以 知道 其 所 代表 的 数值 大 小 。 
在 现实 生活 中 ， 当 遇 到 很 长 的 数字 的 时 候 ， 我 们 采取 的 是 分 段 分 隔 的 
万 式 。 比 如 数字 500000， 我 们 通常 会 写成 500，000， 即 每 三 位 数字 用 


逗号 分 隔 。 利 用 这 种 方式 就 可 以 很 快 知道 效 值 的 大 小 。 这 种 做 法 的 理 
念 被 加 入 到 了 Java 7 中 ， 不 过 用 的 不 是 逗号 ， 而 是 下 男 线 “_”。 

在 Java 7 中 ， 数 值 字面 量 ， 不 管 是 整数 还 是 浮 点 数 ， 都 允许 在 数字 
之 间 插 入 任意 多 个 下 男 线 。 这 些 下 男 线 不 会 对 字面 量 的 数值 产生 影 
响 ， 其 目的 主要 是 方便 阅读 。 


代码 清单 3-29 ”二进制 示例 2 

import static java.lang.System.out; 

public class BinaryIntegralliteral { 

public void display (){ 

out .println (0b001001) ;// 输 出 9 
out.println(0B001110) ;// 输 出 14 
out.println(1 500 500);// 输 出 1500500 
out.println(5 6.3 4);// 输 出 56.34 
out.println(89 3 1);// 输 出 8931 


public static void main(String[] args) { 
BinaryIntegralliteral b = new BinaryIntegralLiteral (); 
b.display(); 

} 

} 


虽然 下 男 线 在 数值 字面 量 中 的 应 用 非常 灵活 ， 但 有 些 情 况 是 不 允 
许 出 现 的 。 最 基本 的 原则 是 下 男 线 只 能 出 现在 数字 中 间 ， 也 就 是 说 前 
后 都 必须 是 数字 。 所 以 “_100”、“120 ” “ob _101”、“0x_da0” 这 样 的 使 
用 方式 都 是 非法 的 ， 无 法 通过 编译 。 这 样 限制 的 动机 在 于 降低 实现 的 
复杂 度 。 有 了 这 个 限制 之 后 ，Java 编 译 器 只 需要 在 扫描 源 代 码 的 时 候 ， 
将 所 发 现 的 数字 中 间 的 下 画 线 直接 删除 就 可 以 了 。 这 样 就 和 没有 使 用 
下 国 线 的 形式 是 相同 的 。 如 果 不 添加 这 个 限制 ， 那 么 编译 器 就 需要 进 
行 语 法 分 析 才 能 做 出 判断 。 比 如 “100? 可 能 是 一 个 整数 字面 量 100， 也 
可 能 是 一 个 变量 名 称 。 这 就 要 求 编译 器 的 实现 做 出 更 加 复杂 的 改动 。 


3.1.19 优化 变 长 参数 的 方法 调用 


J2SE 5.0 中 引入 的 一 个 新 特性 就 是 允许 在 方法 声明 中 使 用 可 变 长 度 
的 参数 。 一 个 方法 的 最 后 一 个 形式 参数 可 以 被 指定 为 代表 任意 多 个 相 
同类 型 的 参数 。 在 调用 的 时 候 ， 这 些 参 数 是 以 数组 的 形式 来 传递 的 。 
在 方法 体 中 也 可 以 按照 数组 的 方式 来 引用 这 些 参数 。 如 下 代码 中 可 以 
对 多 个 整数 进行 求 和 ， 可 以 用 类 似 sum (1, 2, 3) 这 样 的 形式 来 调用 
此 方法 。 


代码 清单 3-30” 变 长 参数 示例 
public int sum(int..args) { 
int result = 0; 
for(int value:args) { 
result += value; 


} 


return result; 


} 


可 变 长 度 的 参数 在 实际 开发 中 可 以 简化 方法 的 调用 方式 。 但 是 在 
Java 7 之 前 ， 如 果 可 变 长 度 的 参数 与 泛 型 一 起 使 用 后 会 遇 到 一 个 麻烦 ， 
就 是 便 一 起 产生 的 警告 过 多 ， 比 如 下 面 Java 6 变 长 参数 示例 。 


public static <T>T useVarargs(T..args) { 
return args.length > O?args[0]:null; 
} 


如 果 人 参数 传递 的 是 不 可 具体 化 (non-eifiable) 的 类 型 ， 如 List < 
String > 这 样 的 泛 型 类 型 ， 会 产生 警告 信息 。 每 一 次 调用 该 方法 ， 都 会 
产生 警告 信息 。 比 如 在 Java 7 之 前 的 编译 器 上 编译 代码 VarargsWarning 
useVarargs (new ArrayList < String> () ) ， 编 译 器 会 给 出 警告 信息 。 
如 果 希 望 禁 止 这 个 警告 信息 ， 需 要 使 用 @ SuppressWarning 

(“unchecked”) 注解 来 声明 。 这 其 中 的 原因 是 可 变 长 度 的 方法 参数 的 
实际 值 是 通过 数组 来 传递 的 ， 而 数组 中 存储 的 是 不 可 具体 化 的 泛 型 类 


对 象 ， 自 身 存 在 类 型 安全 问题 。 因 此 编译 器 会 给 出 相应 的 警告 信息 。 
这 样 的 警告 信息 在 使 用 Java 标准 类 库 中 的 java.util.Arrays 类 的 asList 和 
java.util.Collections 类 的 addAll 方 法 中 也 会 遇 到 。 建 议 开 发 人 员 每 次 使 用 
方法 时 都 抑制 编译 器 的 警告 信息 ， 这 个 不 是 一 个 好 主意 。 

为 了 解决 这 个 问题 ，Java 75| 入 了 一 个 新 的 注解 @Safevarargs。 如 
果 开 发 人 员 确 信 某 个 使 用 了 可 变 长 度 参数 的 方法 ， 在 与 泛 型 类 一 起 使 
用 时 不 会 出 现 类 型 安全 问题 ， 就 可 以 用 这 个 注解 进行 声明 。 在 使 用 了 
这 个 注解 之 后 ， 编 译 器 遇 到 类 似 的 问题 ， 就 不 会 再 给 出 相关 的 警告 信 
Bo 

@Safevarargs 注 解 只 能 用 在 参数 长 度 可 变 的 方法 或 构造 方法 上 ， 且 
方法 必须 声明 为 static 或 final， 否 则 会 出 现 编译 错误 。 一 个 方法 是 用 @ 
SafeVvarargs 注 解 的 前 提 是 ， 开 发 人 员 必 须 确保 这 个 方法 的 实现 中 对 泛 型 
类 型 参数 的 处 理 不 会 引发 类 型 安全 问题 。 


3.1.20 针对 基本 数据 类 型 的 优化 


Java7 对 基本 类 型 的 包装 类 做 了 一 些 更 新 ， 以 更 好 地 满足 日 常 的 开 
发 需求 。 第 一 个 更 新 是 在 基本 类 型 的 比较 方面 ，Boolean、 Byte、 
Short、Integer、Long 和 Character 类 都 添加 了 一 个 比较 两 个 基本 类 型 值 
的 静态 compare 方 法 ， 比 如 Long 类 的 compare 方 法 可 以 用 来 比较 两 个 
Long 类 型 的 值 。 这 个 compare 方 法 只 能 简化 进行 基本 类 型 数值 比较 时 的 
代码 。 在 Java7 之 前 ， 如 果 需 要 对 两 个 int 数 值 x 和 y 进 行 比较 ， 一 般 的 做 
法 是 使 用 代码 “Integervalue (x) .compareTo (Integervalue (y) ) ”， 
而 在 Java7 直 接 使 用 “Integer.compare (x, y) ”。 

字符 串 内 部 化 (string interning) 技术 可 以 提高 字符 串 比较 时 的 性 
能 ， 是 一 种 典型 的 空间 换 时 间 的 做 法 。 在 Java 中 包含 相同 字符 的 字符 串 
字面 量 引 用 的 是 相同 的 内 部 对 象 。String 类 也 提供 了 intem 方 法 来 返回 与 
当前 字符 串 内 容 相同 的 但 已 经 包含 在 内 部 缓存 中 的 对 象 引 用 。 在 对 被 
内 部 缓存 的 字符 串 进行 比较 时 ， 可 以 直接 使 用 “==” 操 作 符 ， 而 不 需要 
用 更 加 耗 时 的 equals 方 法 。 

Java7 把 这 种 内 部 化 机 制 扩 大 到 了 -128 人 127 的 数字 。 根 据 Java 语 言 
规范 ， 对 于 -128 到 127 范 围 内 的 short 类 型 和 int 类 型 ， 以 及 \u0000 到 \u007f 
范围 内 的 char 类 型 ， 它 们 对 应 的 包装 类 对 象 始终 指向 相同 的 对 象 ， 即 通 


过 “==” 进 行 判断 时 的 结果 为 tue。 为 了 满足 这 个 要 求 ，Byte、Short、 
Integer 类 的 valueOf 方 法 对 于 -128 到 127 范 围 内 的 值 ， 以 及 Character 类 的 
valueOf 方 法 对 于 0 到 127 范 围 内 的 值 ， 都 会 返回 内 部 缓存 的 对 象 。 如 果 
希望 缓存 更 多 的 值 ， 可 以 通过 Java 虚 拟 机 启动 参数 
“java.lang.Integer.Integer-Cache.high” 来 进行 设置 。 例 如 ， 使 用 “- 
Djava.lang.Integer.IntegerCache.high=256” 之 后 ， 数 值 缓存 的 范围 就 变 成 
了 -128 到 256。 


3.1.21 空 变量 


显 式 地 赋 空 变量 是 否 有 助 于 程序 的 性 能 。 赋 空 变量 是 指 简单 地 将 
null 值 显 式 地 赋值 给 这 个 变量 ， 相 对 于 让 该 变量 的 引用 失去 其 作用 域 。 


代码 清单 3-31 局 部 作用 域 


public static String scopingExample (String string 


{ 
StringBuffer sb = new StringBuffer (); 
sb.append("hello ").append(string); 

Sb.append(", nice to see you!"); 

return sb.toString(); 


} 


如 清单 3-31 所 示 ， 当 该 方法 执行 时 ， 运 行 时 栈 保留 了 一 个 对 
StringBuffer 对 象 的 引用 ， 这 个 对 象 是 在 程序 的 第 一 行 产生 的 。 在 这 个 
方法 的 整个 执行 期 间 ， 栈 保存 的 这 个 对 象 引 用 将 会 防止 该 对 象 被 当 作 
垃圾 。 当 这 个 方法 执行 完毕 ， 变 量 sb 也 就 失去 了 它 的 作用 域 ， 相 应 地 
运行 时 栈 就 会 删除 对 该 StringBuffer 对 象 的 引用 。 于 是 不 再 有 对 该 
StringBuffer 对 象 的 引用 ， 现 在 它 就 可 以 被 当 作 垃圾 收集 了 。 栈 删除 引 
用 的 操作 就 等 于 在 该 方法 结束 时 将 null 值 赋 给 变量 sb。 

既然 Java 虚 拟 机 可 以 执行 等 价 于 赋 空 的 操作 ， 那 么 显 式 地 赋 空 变量 
还 有 什么 用 呢 ? 对 于 在 正确 的 作用 域 中 的 变量 来 说 ， 显 式 地 赋 空 变量 
的 确 没 用 。 但 是 让 我 们 来 看 看 另外 一 个 版 本 的 scopingExample 方 法 ， 
如 代码 清单 3-32 所 示 ， 这 一 次 我 们 将 把 变量 sb 放 在 一 个 错误 的 作用 域 
中 。 


代码 清单 32 BERI 
static StringBuffer Sb = new StringBuffer(); 
public static String scopingExample(String string) { 
Sb = new StringBuffer(); 
Sb.append("hello ").append(string); 
Sb.append(", nice to see you!"); 
return sb.toString(); 


} 


现在 sb 是 一 个 静态 变量 ， 所 以 只 要 它 所 在 的 类 还 装载 在 Java 虚 拟 机 
中 ， 它 也 将 一 直 存 在 。 该 方法 执行 一 次 ， 一 个 新 的 StringBuffer 将 被 创 
建 并 且 被 sb 变量 引用 。 在 这 种 情况 下 ，sb 变 量 以 前 引用 的 StringBuffer 对 
象 将 会 死亡 ， 成 为 垃圾 收集 的 对 象 。 也 就 是 说 ， 这 个 死亡 的 
StringBuffer 对 象 被 程序 保留 的 时 间 比 它 实 际 需要 保留 的 时 间 长 得 多 ， 
如 果 再 也 没有 对 该 scopingExample 方 法 的 调用 ， 它 将 会 永远 保留 下 去 。 

即使 如 此 ， 显 式 地 赋 空 变量 能 够 提高 性 能 吗 ? 我 们 会 发 现 我 们 很 
难 相 信 一 个 对 象 会 或 多 或 少 对 程序 的 性 能 产生 很 大 影响 ， 直 到 清单 3-33 
所 示 ， 它 包含 了 一 个 大 型 对 象 。 


代码 清单 3-33. 仍 在 静态 作用 域 中 的 对 象 


private static Object bigObject; 


public static void test (int size) { 
long startTime = System.currentTimeMillis(); 
long numObjects - 0; 
while (true) ( 
//bigObject = null; //explicit nulling 
//SizableObject could simply be a large array, e.g. byte[] 
//In the JavaGaming discussion it was a BufferedImage 
bigObject = new SizableObject (size); 
long endTime = System.currentTimeMillis(); 
**numObjects; 
// We print stats for every two seconds 
if (endTime - startTime >= 2000) | 
System.out.println("Objects created per 2 seconds = " + numObjects); 
startTime = endTime; 
numObjects = 0; 
} 
} 
} 


这 个 例子 有 个 简单 的 循环 ， 创 建 一 个 大 型 对 象 并 且 将 它 赋 给 同一 
个 变量 ， 每 隔 两 秒 钟 报告 一 次 所 创建 的 对 象 个 数 。 现 在 的 Java 虚 拟 机 采 
用 generational 垃圾 收集 机 制 ， 新 的 对 象 创建 之 后 放 在 一 个 内 存 空 间 
( 取 名 Eden) 内 ， 然 后 将 那些 在 第 一 次 垃圾 收集 以 后 仍然 保留 的 对 象 
转移 到 另外 一 个 内 存 空 间 。 在 Eden， 即 创建 新 对 象 时 所 在 的 新 一 代 空 
间 中 ， 收 集 对 象 要 比 在 “ 老 一 代 ” 空 间 中 快 得 多 。 但 是 如 果 Eden 空间 已 
经 满 了 ， 没 有 空间 可 供 分 配 ， 那 么 就 必须 把 Eden 中 的 对 象 转移 到 老 一 
代 空 间 中 ， 腾 出 空间 来 给 新 创建 的 对 象 。 如 果 没 有 显 式 地 赋 空 变量 ， 
而 且 所 创建 的 对 象 足够 大 ， 那 么 Eden 就 会 填 满 ， 并 且 垃 圾 收集 器 就 不 


能 收集 当前 所 引用 的 这 个 大 型 对 象 。 所 产生 的 后 果 是 ， 这 个 大 型 对 象 
被 转移 到 “ 老 一 代 空 间 ”， 并 且 要 花 更 多 的 时 间 来 收集 它 。 

通过 显 式 地 赋 空 变量 ，Eden 就 能 在 新 对 象 创 建 之 前 获得 自由 空 
间 ， 这 样 垃圾 收集 就 会 更 快 。 实 际 上 ， 在 显 式 赋 空 的 情况 下 ， 该 循环 
在 两 秒 钟 内 创建 的 对 象 个 数 是 没有 显 式 赋 空 时 的 5 倍 -- 但 是 仅 当 您 选择 
创建 的 对 象 要 足够 大 而 可 以 填 满 Eden 时 才 是 如 此 ， 在 Windows 环境 、 
Java 虚 拟 机 1.4 的 默认 配置 下 大 概 需 要 500KB。 那 就 是 一 行 赋 空 操作 产 
生 的 5 倍 的 性 能 差距 。 但 是 请 注意 这 个 性 能 差别 产生 的 原因 是 变量 的 
作用 域 不 正确 ， 这 正 是 赋 空 操作 发 挥 作用 的 地 方 ， 并 且 是 因为 所 创建 
的 对 象 非 常 大 。 


3.2 集合 类 概念 


Java Collection 类 为 程序 员 的 生产 力 带 来 了 巨大 的 提升 ， 其 提供 的 
接口 容器 ， 可 以 方便 地 在 各 种 具体 实现 之 间 切 换 。 

Collection 类 的 某 些 具体 实现 基于 数组 ， 即 由 于 底层 数据 存储 基于 
数组 ， 随 着 元 素数 量 的 增加 ， 调 整 大 小 的 代价 很 大 ， 典 型 的 代表 如 
ArrayList, Vector, HashMap 及 ConcurrentHashMap。 另 一 些 Collection 
类 的 实现 ， 如 LinkedList 或 TreeMap ， 常 使 用 一 个 或 多 个 对 象 引 用 ， 将 
Collection 类 管理 的 各 个 元 素 串 接 起 来 。 这 些 Collection 类 实现 中 的 前 
者 ， 使 用 数组 作为 底层 的 数据 存储 ， 随 着 Collection 元 素 增 长 到 某 个 上 
限 ， 需 要 调整 其 大 小 时 很 容易 出 现 性 能 问题 。 虽 然 这 些 Collection 类 也 
含有 构造 水 数 ， 可 以 接收 优化 的 参数 值 作 为 Collection 的 大 小 ， 但 构造 
了 为 数 并 不 经 常 被 使 用 ， 或 者 应 用 程序 中 提供 的 大 小 并 没有 针对 该 
Collection 类 做 优化 。 

以 StringBuilder/StringBuffer 为 例 ， 使 用 数组 作为 数据 存储 的 Java 
Collection 类 需要 消耗 额外 的 CPU 周期 分 配 新 数组 ， 将 老 的 元 素 从 旧 数 
组 中 复制 到 新 数组 中 ， 在 将 来 的 某 个 时 刻 还 需要 对 数组 进行 垃圾 收 
集 。 此 外 ， 调 整 大 小 还 会 影响 Collection 类 字段 的 访问 时 间 及 解析 引用 
字段 的 时 间 ， 因 为 作为 一 个 新 的 底层 数据 存储 〈 典 型 的 即 为 数组 ) ， 
它 可 能 被 分 配 到 JVM 堆 中 的 某 个 位 置 ， 与 Collection 类 中 其 他 的 字段 及 
对 象 引 用 不 在 同一 块 内 存 存 储 。Collection 类 发 生 大 小 调整 后 ， 访 问 调 


整 后 的 字段 可 能 会 导致 CPU 高 速 缓存 未 命中 ， 这 是 由 现代 JVM 在 内 存 
中 分 配对 象 的 方式 导致 的 ， 尤 其 是 对 象 在 内 存 中 如 何 分布 决 定 的 。 不 
同 的 Java 虚 拟 机 实现 中 ， 对 象 及 其 字段 在 内 存 中 的 分 布 可 能 有 所 不 同 。 
然而 ， 一 般 来 说 ， 由 于 对 象 及 其 字段 常常 需要 同时 引用 ， 将 对 象 及 其 
字段 尽 可 能 放 在 内 存 中 相 邻 的 位 置 能 够 减少 CPU 高 速 缓存 未 命中 。 由 
此 可 见 ，Collection 类 大 小 调整 的 影响 已 经 远 远 不 止 大 小 调整 所 额外 消 
耗 的 CPU 指 令 ， 还 会 对 JVM 的 内 存 管 理 器 造成 影响 ， 由 于 改变 了 内 存 
中 Collection 类 字段 相对 于 对 象 实例 的 布局 ， 字 段 的 访问 时 间 将 会 变 
长 。 本 市 要 讲解 针对 集合 相关 数据 结构 使 用 的 优化 建议 。 


3.2.1 快速 删除 List 里 面 的 数据 


java.util.List 的 subList 方 法 可 以 被 用 来 返回 一 个 集合 (List) 的 一 部 
分 的 数据 。 

List < E > subList (int fromIndex, inttoIndex) ， 该 方法 定义 返回 
原 有 集合 的 从 fromIndex 到 toIndex 之 间 这 一 部 分 的 数据 ， 组 成 一 个 新 的 
集合 ， 这 两 个 集合 之 间 是 有 关联 的 。 所 以 ， 你 对 原来 的 list 和 返回 的 list 
做 的 非 结 构 性 修改 [3]， 都 会 影响 到 彼此 对 方 。 如 果 发 生 结构 性 修改 的 
是 原来 的 list (不 包括 由 于 返回 的 子 list 导致 的 改变 ) ， 那 么 返回 的 子 
list 语义 上 将 会 是 undefined。 在 AbstractList 中 ，undefined 的 具体 表现 
形式 是 抛 出 一 个 ConcurrentModificationExceptiono 


因此 ， 如 果 你 在 调用 了 sublist 返 回 了 子 list 之 后 ， 假 设 这 个 时 候 你 又 
修改 了 原 list 的 大 小 ， 那 么 之 前 产生 的 子 list 就 会 失效 ， 即 子 list 会 变 成 不 
可 用 状态 。 相 应 地 ， 如 果 你 想 要 修改 原 有 的 list， 你 也 可 以 通过 调用 
sublist 的 方式 来 实现 这 个 需求 ， 即 调用 代码 list.subList (from ， 
to) .clear () 。 

如 清单 3-34 所 示 ， 通 过 对 返回 的 队列 、 原 队列 进行 修改 ， 也 会 触发 
对 应 的 变化 。 


代码 清单 3-34 sublist 示例 


import java.util.Arraylist; 
import java.util.List; 
public class testSublist { 


public static void main(String[] args) { 


List<String> parentList = new ArrayList<String>(); 


for(int i = 0; i < 5; it*)( 


parentList.add(String.valueOf(i)); 


List<String> subList = parentList.subList(1, 3); 
for(String s : subList) { 
System.out.println(s);//output: 1, 2 
) 
System.out.println("--------------------- "ys 
//non-structural modification by sublist, reflect parentList 
subList.set(0, "new 1"); 
for(String s : parentList) { 
System.out.println(s);//output: 0, new 1, 2, 3, 4 
) 
System .out.println ("= ======= aa ms 
//structural modification by sublist, reflect parentList 
subList.add(String.valueOf(2.5)); 
for(String s : parentList) { 
System.out.println(s);//output:0, new 1l, 2, 2.5, 3, 4 
) 
System.out.printin("--------------——-—-c- "s 
//non-structural modification by parentList, reflect sublist 
parentList.set(2, "new 2"); 
for(String s : subList) { 
System.out.println(s);//output: new 1, new 2 
) 
Svstem.out.println ["--------— mo mj s 
//structural modification by parentList, sublist becomes undefined (throw 
exception) 
parentList.add("undefine"); 
for(String s : subList) { 
System.out.println(s); 
) 
System Gut- printli (W--------------------- "g 
subList.get (0); 


清单 3-34 程 序 运 行 之 后 的 输出 如 清单 3-35 所 示 。 


代码 清单 3-35 运行 程序 输出 


Exception in thread "main" java.util.ConcurrentModificationException 
at java.util.ArrayList$SubList.checkForComodification (Unknown Source) 
at java.util.ArrayList$SubList.listIterator (Unknown Source) 


at java.util.AbstractList.listIterator (Unknown Source) 


at java.util.ArrayList$SubList.iterator (Unknown Source) 


at testSubString.main(testSubString.java:38) 


3.2.2 集合 内 部 避免 返回 null 


当 我 们 在 需要 返回 数组 或 者 集合 的 方法 中 ， 如 果 需 要 返回 空 数 
据 ， 则 不 要 返回 null， 而 是 要 返回 大 小 为 0 的 数组 或 者 集合 。 
如 代码 清单 3-36 所 示 代 码 ， 当 队列 大 小 为 0 时 ， 返 回 Null。 


代码 清单 336 ”集合 返回 空 示例 
private final List<String> bookInStock; 
[** 
* @return an array containing all of the book in the shop, 
* or null if no book are available for purchase. */ 
public String[] getBooks() { 
if (bookInStock.size() == 0) 


return null; 


} 


采用 这 种 返回 Null 的 方式 ， 会 导致 一 个 问题 ， 就 是 调用 这 个 集合 时 
必须 要 判断 这 个 方法 返回 的 是 否 为 nmull， 否 则 ， 可 能 会 抛 出 
NullPointerException 异 常 ， 如 代码 清单 3-37 所 示 。 


代码 清单 3-37 判断 Null 

Book[] books = shop.getBooks(); 

if (books!- null && Arrays.asList (books) .contains (books.STILTON))|( 

System.out.println("Sorry, Empty! .") ; 

} 

坚持 选择 返回 null 的 原因 可 能 是 认为 分 配 一 个 空 数组 或 者 集合 是 需 
要 伦 费 时 间 和 空间 的 ， 这 样 会 间接 影响 性 能 。 但 是 总 的 来 说 ， 这 点 性 
能 损耗 很 小 ， 此 外 ， 返 回 的 空 数组 或 者 集合 通常 是 immutable， 即 不 可 
变 的 [4] ， 所 以 可 以 定义 成 static final (对 于 数组 而 言 ) 或 者 
Collections.emptyList () /emptyMap () /emptySet () 来 公用 同一 个 对 
象 ， 减 少 性 能 影响 。 实 现 方 式 如 清单 3-38 所 示 。 


代码 清单 3-38 正确 的 返回 方式 
// The right way to return an array from a collection 
private final List<Book>bookInStock = ...; 
private static final Book [] EMPTY BOOK ARRAY - new Book[0]; 
/xx (return an array containing all of the book in the shop. 
RI 
public Book[] getBook() { 
return bookInStock.toArray(EMPTY BOOK ARRAY); 
} 
// The right way to return a copy of a collection 
public List<Book> getBookList() { 
if (bookInStock. isEmpty ()) { 
return Collections.emptyList (); 
// Always returns same list 
Jelse[ 
return new ArrayList<Book>(bookInStock) ; 
} 
} 


结合 上 面 的 代码 及 描述 信息 ， 总 的 来 说 ， 对 于 集合 可 能 为 空 的 应 
用 程序 我 们 需要 注意 以 下 几 点 : 

(1) 自己 写 接口 方法 时 尽量 遵守 这 条 规范 ， 并 在 方法 注释 中 标 
明 ， 尽 量 返 回 大 小 为 0 的 数组 或 者 集合 。 

(2) 文中 提 到 的 Collections.emptyList () 这 个 方法 需要 慎 用 。 
为 这 个 方法 返回 的 集合 对 象 都 是 immutable 的 ， 即 不 可 更 改 的 。 而 有 时 
候 我 们 可 能 需要 向 返回 的 集合 中 添加 或 者 删除 元 素 ， 这 样 的 话 ， 就 会 
触发 UnsupportedOperationException 异 常 。 

(3) 当 要 判断 某 个 元 素 是 否 在 数组 中 时 ， 可 以 采用 Arrays.asList 
(T[]array) .contains (T obj) ) 来 作为 实现 方案 ， 而 无 须 用 循环 迭代 
每 个 元 素来 判断 。 


(4) 如 果 要 把 ArrayList 变 成 数组 ， 可 以 使 用 ArrayList.toArray (T 
[ aray) ， 人 参数 里 的 array 只 需 设 成 大 小 为 0 的 数组 即 可 ， 仅 用 来 指定 返 
回 的 类 型 ，T 可 能 为 ArrayList 中 元 素 的 子 类 。 


3.2.3 ArrayList、LinkedList 比 较 


ArrayList、Vector、LinkedList 均 来 自 抽 象 类 AbstractList 的 实现 ， 
而 AbstractList 扩展 自 AbstarctCollection ， 并 直接 实现 了 List 接口 。 
AbstractList 最 大 限度 地 减少 了 实现 由 “随机 访问 ”数据 存储 (如 数组 ) 
支持 的 接口 所 需 的 工作 。 需 要 注意 的 是 ， 对 于 连续 的 访问 数据 GU 
表 ) ， 应 优先 使 用 AbstractSequentialList， 这 个 抽象 类 最 大 限度 地 减少 
了 实现 受 “ 连 续 访问 ”数据 存储 (如 链接 列表 ) 支持 的 此 接口 所 需 的 工 
{Fo 

ArrayList 和 Vector 使 用 数组 原理 实现 ， 其 中 ArrayList 没 有 对 任何 一 
个 方法 做 线程 同步 保护 ， 因 此 整体 上 来 说 ，ArrayList 不 是 线程 安全 
BY. Vector 中 绝 大 部 分 方法 都 做 了 线程 同步 ， 所 以 可 以 说 它 是 线程 安全 
的 实现 。LinkedList 使 用 了 循环 双向 链表 数据 结构 ， 由 一 系列 表 项 连接 
而 成 ， 一 个 表 项 由 3 个 部 分 组 成 ， 即 元 素 内 容 、 前 驱 表 项 和 后 驱 表 项 。 

当 ArrayList 对 容量 的 需求 超过 当前 数组 预定 义 的 最 大 限度 时 ， 数 
组 需要 进行 扩容 ， 扩 容 过 程 中 会 进行 大 量 的 数组 复制 操作 ， 而 对 于 数 
组 复制 操作 来 说 ， 最 终 将 调用 System.arraycopy () 方法 。LinkedList 由 
于 使 用 了 链表 的 结构 ， 因 此 不 需要 维护 容量 的 大 小 ， 然 而 每 次 新 增 元 
素 时 都 需要 新 建 一 个 Entry 对 象 ， 并 进行 更 多 的 赋值 操作 ， 因 此 在 频繁 
的 系统 调用 下 ， 容 易 对 性 能 产生 一 定 的 影响 ， 在 不 间断 地 生成 新 的 对 
象 过 程 中 占用 了 一 定 的 资源 。 

前 面 说 过 ，ArrayList 是 基于 数组 实现 的 ， 数 组 是 一 块 连续 的 内 存 
空间 ， 因 为 数组 的 连续 性 ， 因 此 总 是 在 尾 端 增加 元 素 ， 只 有 在 空间 不 
足 时 才 产 生 数 组 扩容 和 数组 复制 。 如 果 在 数组 的 任意 位 置 插入 元 素 ， 
必然 导致 在 该 位 置 后 的 所 有 元 素 需 要 重新 排列 ， 因 此 其 效率 较 差 ， 尽 
可 能 将 数据 插入 到 尾部 。LinkedList 由 于 基于 链表 数据 结构 ， 因 此 不 会 
因为 插入 数据 而 导致 性 能 下 降 。 

总 的 来 说 ，ArrayList 人 允许 所 有 元 素 ， 可 以 包括 Null 元 素 ， 并 可 以 根 
据 索引 位 置 对 集合 进行 快速 的 随机 访问 ， 缺 点 是 向 指定 的 索引 位 置 插 


入 对 象 或 删除 对 象 的 速度 较 慢 。ArrayList 的 每 一 次 有 效 的 元 素 删 除 操 
作 后 都 要 进行 数组 的 重组 ， 并 且 删 除 的 元 素 位 置 越 靠 前 ， 数 组 重组 时 
的 开销 越 大 ， 要 删除 的 元 素 位置 越 靠 后 ， 开 销 越 小 。LinkedList 要 移 除 
中 间 的 数据 需要 便利 完 半 个 List。 


清单 3-39 所 示 代 码 演 示 了 ArrayList 和 LinkedList 的 操作 方式 。 


代码 清单 3-39 ArrayList 和 LinkedList 示例 代码 


import java.util.ArrayList; 
import java.util.LinkedList; 


public class ArrayListandLinkedList { 
public static void main(String[] args) { 
long start = System.currentTimeMillis(); 
ArrayList list = new Arraylist(); 
Object obj = new Object () ; 
for(int 1=0;1<5000000;i++) { 
list.add (obj) ; 
} 
long end = System.currentTimeMillis(); 


System. out.println(end-start) ; 


start = System.currentTimeMillis(); 

LinkedList listl = new LinkedList(); 

Object objl = new Object () ; 

for(int i=0;1<5000000; i++) { 
listl.add(objl); 


] 
end = System.currentTimeMillis(); 


System.out.println(end-start); 


start = System.currentTimeMillis(); 

Object obj2 = new Object(); 

for(int 1=0;1<1000;i++) { 
list.add(0,0b32); 

} 

end = System.currentTimeMillis(); 


System. out.println(end-start) ; 


start = System.currentTimeMillis(); 

Object obj3 = new Object () ; 

for(int i1=0;1<1000;it+) { 
listl.add(obj1); 

} 

end = System.currentTimeMillis(); 


System. out.println(end-start) ; 


start = System.currentTimeMillis(); 
list. remove (0) ; 
end = System.currentTimeMillis(); 


System. out.println(end-start) ; 


start = System.currentTimeMillis(); 
listl.remove (250000) ; 
end = System.currentTimeMillis(); 


System, out.println(end-start) ; 


程序 对 ArrayList 和 LinkedList 分 别 执行 插入 数据 、 删 除数 据 操 作 ， 
输出 各 个 操作 所 消耗 的 时 间 ， 单 位 为 秒 。 本 实验 中 ， 第 一 次 插入 数据 
时 ，ArrayList 插 入 500 万 元 素 时 比 同 样 操作 方式 下 的 LinkedList 要 快 将 近 
2 倍 。 但 是 当初 始 化 成 功 后 ， 继 续 向 ArrayList 新 增 1000 个 元 素 时 ， 速 度 
较 同 样 情况 下 的 LinkedList 慢 很 多 。 删 除数 据 的 时 间 ArrayList Eb 
LinkedList 要 快 。 具 体 运行 输出 如 清单 3-40 所 示 。 


代码 清单 3-40 清单 3-39 运行 输出 
639 
1296 
6969 
0 
0 
15 


从 上 面 的 实验 我 们 可 以 得 出 ， 如 果 数 据 较为 稳定 ， 不 容易 发 生 新 
增 操作 ， 那 么 我 们 可 以 考虑 使 用 ArrayList。 如 果 容 易 发 生 修 改 ， 例 如 
互联 网 应 用 场景 ， 应 用 面向 的 是 大 众 用 户 平台 ， 元 素 的 修改 较为 频 
繁 ， 那 么 我 们 可 以 考虑 使 用 LinkedList。 

LinkedList 采 用 的 数据 结构 导致 了 它 的 排序 方式 不 同 ， 也 导致 了 它 
获取 数据 的 方式 不 同 。 假 设 我 们 的 程序 顺序 访问 一 个 LinkedList 的 元 
素 ， 我 们 会 发 现 随 着 index 的 变 大 ， 程 序 速度 会 越 来 越 慢 ，1list 的 元 素 个 
数 在 百 万 以 上 。 下 面 程序 中 错误 的 代码 就 是 使 用 了 list.get (i) , ER 
顺序 访问 ，LinkedList 绝 对 不 要 用 get 方 法 ， 即 使 LinkedList 的 元 素 个 数 
只 有 很 少 的 几 个 。 发 生 这 个 情况 的 原因 是 LinkedList 的 底层 是 一 个 链 
表 ， 随 机 访问 i 的 时 候 ， 链 表 只 能 从 前 往 后 数 ， 第 i 个 才 返 回 。 所 以 时 间 
随 着 的 变 大 时 间 会 越 来 越 长 。 程 序 代码 如 代码 清单 3-41 所 示 。 


代码 清单 3-41 LinkedList 错误 的 使 用 方式 


import java.util.LinkedList; 


import java.util.List; 


public class LinkedListWrongDemo { 
public static void main(String[] args) | 
// add elements 
int size - 2000000; 
List<String> list = new LinkedList<String>(); 
for (int i = 0; i < size; itt) { 
list.add("Just some test data"); 


long startTime = System.currentTimeMillis(); 
for (int i = 0; i < size; itt) { 
list.get (1); 
if (i $ 10000 == 0) { 
System.out.println("query 10000 elements spend: "+ 
(System.currentTimeMillis() - startTime)); 


startTime = System.currentTimeMillis(); 


} 
代码 清单 3-41 所 示 的 代码 运行 后 打印 输出 如 代码 清单 3-42 所 示 。 


代码 清单 3-42 3-41 代码 运行 输出 
query 10000 elements spend: 0 
uery 10000 elements spend: 375 


uery 10000 elements spend: 1639 


q 
query 10000 elements spend: 983 
q 
q 


uery 10000 elements spend: 2388 


uery 10000 elements spend: 2981 


ery 10000 elements spend: 3448 
uery 10000 elements spend: 2653 
uery 10000 elements spend: 2560 
uery 10000 elements spend: 2949 


uery 10000 elements spend: 3230 


此 外 ， 这 里 介绍 一 下 RandomAccess 接 口 。RandomAccess 接 口 是 一 
个 标志 接口 ， 它 本 身 并 没有 提供 任何 方法 ， 实 现 了 RandomAccess 接 口 
的 对 象 都 可 以 被 认为 是 支持 快速 随机 访问 的 对 象 。 该 接口 的 主要 目的 
是 标识 那些 可 支持 快速 随机 访问 的 List 实 现 。 随 机 和 连续 访问 之 间 的 区 
别 通 常 是 模糊 的 。 例 如 ， 如 果 列 表 很 大 时 ， 某 些 List 实 现 提供 渐进 的 线 
性 访问 时 间 ， 但 实际 上 是 固定 的 访问 时 间 。 这 样 的 List 实 现 通常 应 该 实 
现 此 接口 。 

任何 一 个 基于 数组 的 List 实 现 都 实现 了 RaodomAccess 接 口 ， 而 基于 
链表 的 实现 则 都 没有 。 因 为 只 有 数组 能 够 进行 快速 的 随机 访问 ， 而 对 
链表 的 随机 访问 需要 进行 链表 的 遍历 。 因 此 ， 此 接口 的 好 处 是 ， 可 以 
在 应 用 程序 中 知道 正在 处 理 的 List 对 象 是 否 可 以 进行 快速 随机 访问 ， 从 
而 针对 不 同 的 List 进 行 不 同 的 操作 ， 以 提高 程序 的 性 能 。 可 以 使 用 list 
instanceof RandonAccess 语 句 来 判断 是 否 是 数组 实现 的 。JDK 中 说 得 很 
清楚 ， 在 对 List 特 别 是 Huge size 的 List 的 遍历 算法 中 ， 要 尽量 来 判断 是 
属于 RandomAccess (如 ArrayList ) 还 是 Sequence List (如 
LinkedList) ， 因 为 适合 RandomAccess List 的 遍历 算法 ， 用 在 Sequence 
List 上 就 差别 很 大 ， 常 用 的 做 法 就 是 要 作 一 个 判断 ， 如 代码 清单 3-43 所 
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代码 清单 3-43 判断 是 否 适合 RandomAccess 
if (list instance of RandomAccess) { 
for(int m = 0; m < list.size(); m++){} 
else( 

Iterator iter = list.iterator(); 


while (iter.hasNext())(] 


Vector 是 javautil 包 的 类 ， 他 的 功能 是 实现 了 一 个 动态 增长 的 数组 ， 
像 其 他 数组 一 样 ， 此 向 量 数组 可 以 为 每 个 包含 的 元 素 分 配 一 下 整数 索 
引号 ， 但 是 ， 向 量 不 同 于 数组 ， 它 的 长 度 可 以 在 创建 以 后 根据 实际 包 
含 的 元 素 个 数 增加 或 减少 。 容 量 因素 的 值 总 是 大 于 向 量 的 长 度 ， 因 为 
当 元 素 被 添加 到 向 量 中 ， 向 量 存储 长 度 的 增加 是 以 增长 幅度 因素 指定 
的 值 来 增加 的 ， 应 用 程序 可 以 在 插入 大 量 元 素 前 ， 先 根据 需要 增加 适 
量 的 向 量 容量 ， 这 样 ， 可 以 避免 增加 多 余 的 存储 空间 。 

Hashtable 类 实现 一 个 哈 希 表 ， 该 哈 希 表 将 键 映射 到 相应 的 值 。 任 
何 非 nul 对 象 都 可 以 用 作 键 或 值 。 为 了 成 功 地 在 哈 希 表 中 存储 和 获取 对 
象 ， 用 作 键 的 对 象 必 须 实现 hashCode 方 法 和 equals 方 法 。 

Hashtable 的 实例 有 两 个 参数 影响 其 性 能 ， 即 初始 容量 和 加 载 因 
子 。 容 量 是 哈 希 表 中 桶 的 数量 ， 初 始 容 量 就 是 哈 希 表 创 建 时 的 容量 。 
注意 ， 哈 希 表 的 状态 为 open， 表 示 在 发 生 “ 哈 希 冲 突 * 的 情况 下 ， 单 个 桶 
会 存储 多 个 条 目 ， 这 些 条 目 必 须 按 顺序 搜索 。 加 载 因 子 是 对 哈 希 表 在 
其 容量 自动 增 


3.2.4 Vector、HashTable 比 较 


加 之 前 可 以 达到 多 满 的 一 个 尺度 。 初 始 容量 和 加 载 因子 这 两 个 参 
数 只 是 对 该 实现 的 提示 。 关 于 何 时 以 及 是 否 调用 rehash 方 法 的 具体 细节 
则 依赖 于 该 实现 。 通 常 ， 默 认 加 载 因子 (0.75) 在 时 间 和 空间 成 本 上 寻 
求 一 种 折 中 。 加 载 因子 过 高 虽然 减少 了 空间 开销 ， 但 同时 也 增加 了 碍 
找 某 个 条 目的 时 间 〈 在 大 多 数 Hashtable 操 作 中 ， 包 括 get 和 put 操 作 ， 都 
反映 了 这 一 点 ) o 


初始 容量 主要 控制 空间 消耗 与 执行 rehash 操 作 所 需要 的 时 间 损 耗 之 
间 的 平衡 。 如 果 初 始 容 量 大 于 Hashtable 所 包含 的 最 大 条 目 数 除 以 加 载 
因子 ， 则 永远 不 会 发 生 rehash 操 作 。 但 是 ， 将 初始 容量 设置 太 高 可 能 会 
浪费 空间 。 如 果 很 多 条 目 要 存储 在 一 个 Hashtable 中 ， 那 么 与 根据 需要 
执行 自动 rehashing 操 作 来 增 大 表 的 容量 的 做 法 相 比 ， 使 用 足够 大 的 初 
台 容量 创建 哈 希 表 或 许可 以 更 有 效 地 插入 条 目 。 

使 用 Vector 或 者 HashTable 的 时 候 ， 我 们 可 以 为 Vector 和 HashTable 定 
义 初始 大 小 ， 我 们 知道 ，Vector 来 自 抽象 类 AbstractList 的 实现 ， 并 且 
Vector 是 基于 数组 实现 的 ， 那 么 JVM 为 Vector 扩充 大 小 的 时 候 需 要 重新 
创建 一 个 更 大 的 数组 ， 首 先 将 原先 数组 中 的 内 容 复 制 过 来 ， 然 后 原先 
的 数组 才 会 被 回收 。 可 见 Vector 容 量 的 扩大 是 一 个 颇 费 时 间 的 事 。 通 
常 ， 默 认 的 10 个 元 素 大 小 是 不 够 的 ， 读 者 最 好 能 根据 实际 应 用 场景 准 
确 的 估计 你 所 需要 的 最 佳 大 小 。 

代码 如 清单 3-44 所 示 ， 由 于 事先 没有 确定 Vector 数组 元 素 个 数 ， 所 
以 每 次 新 增 元 素 时 都 需要 执行 复制 操作 ， 较 为 耗 时 。 


代码 清单 34M Vector 示例 代码 
import java.util.vector; 
public class VectorDemo{ 
public void addobjects (object[] o) { 
// if length > 10, vector needs to expand 
for (int i = 0; i< o.length;it*) { 
v.add(o);  // capacity before it can add more elements. 
] 
} 
public vector v = new vector(); // no initialcapacity. 


} 


我 们 可 以 通过 public vector v=new vector (20) ; public hashtable 
hash=new hashtable (10) ; 这 样 的 方式 自己 设 定 初始 大 小 。 

需要 读者 注意 ， 单 线程 应 尽量 使 用 HashMap、ArrayList， 除 非 必 
要 ， 人 否则 不 推荐 使 用 HashTable、Vector， 这 两 个 类 使 用 了 同步 机 制 ， 反 


而 会 降低 性 能 。JDK 的 发 展 过 程 是 ， 用 ArrayList 代 替 Vector。 Vector 是 
线程 安全 的 ， 而 有 的 时 候 我 们 确实 希望 在 多 线程 的 情况 下 使 用 列表 ， 
那么 这 个 时 候 我 们 可 以 利用 Collections 这 个 类 当中 为 我 们 提供 的 
synchronizedList (List list) ， 它 可 以 返回 一 个 线程 安全 的 同步 的 列 
表 ， 还 提供 了 返回 同步 的 Collections。 用 HashMap 人 代替 Hashtable。 
Hashtable 是 线程 安全 的 ， 而 有 的 时 候 我 们 确实 希望 在 多 线程 的 情况 下 
使 用 HashMap ， 那 么 这 个 时 候 我 们 可 以 利用 Collections 这 个 类 当中 为 我 
们 提供 的 synchronizedMap (Map<K, V>m) ， 它 可 以 返回 一 个 线程 
安全 的 同步 的 HashMap。 用 LinkedList 代 替 Stack。 当初 在 设计 Stack 的 时 
候 就 有 一 些 潜在 的 问题 ， 它 是 从 Vector 继 承 而 来 ， 对 于 一 个 栈 来 说 ， 它 
只 能 是 最 后 放 进 去 的 元 素 ， 要 先 出 来 ， 但 是 它 继承 自 Vector， 而 Vector 
中 有 一 个 方法 叫 作 elementAt (int index) ， 而 不 能 说 是 通过 这 个 索引 
index 去 任意 的 获得 一 个 元 素 。 结 果 它 就 有 了 这 个 奇怪 的 特性 ， 提 倡 应 
该 自己 利用 LinkedList 去 实现 一 个 stack。 


3.2.5 HashMap 使 用 经 验 


小 时 候 妈 妈 都 教 过 我 们 ， 不 同 的 东西 要 放 在 不 同 的 位 置 ， 需 要 时 
才能 快速 找到 它 。 当 然 这 个 规则 你 必须 记 住 ， 不 然 怎 么 都 找 不 到 了 。 
HashMap 之 所 以 能 够 做 到 快速 存 、 取 ， 与 我 们 下 面 要 介绍 的 内 容 密 切 
相关 。 

HashMap l HashSet  JavaCollection Framework 的 两 个 重要 成 员 ， 
其 中 HashMap 是 Map 接 口 的 常用 实现 类 ，HashSet 是 Set 接 口 的 常用 实现 
类 。 虽 然 HashMap 和 HashSet 实 现 的 接口 规范 不 同 ， 但 它们 底层 的 Hash 
存储 机 制 完 全 一 样 ， 甚 至 HashSet 本 身 就 采用 HashMap 来 实现 的 。 读 者 
请 注意 ， 虽 然 集合 号 称 存 储 的 是 Java 对 象 ， 但 实际 上 并 不 会 真正 将 Java 
对 象 放 入 Set 集 合 中 ， 只 是 在 Set 集 合 中 保留 这 些 对 象 的 引用 而 言 。 也 就 
是 说 : Java 集 合 实 际 上 是 多 个 引用 变量 所 组 成 的 集合 ， 这 些 引 用 变量 指 
向 实际 的 Java 对 象 。 就 像 引 用 类 型 的 数组 一 样 ， 当 我 们 把 Java 对 象 放 入 
数组 之 时 ， 并 不 是 真正 把 Java 对 象 放 入 数组 中 ， 只 是 把 对 象 的 引用 放 入 
数组 中 ， 每 个 数组 元 素 都 是 一 个 引用 变量 。 

我 们 首先 来 谈 谈 HashMap。 了 HashMap 是 基于 哈 希 表 的 Map 接 口 的 实 
现 ，HashMap 将 Hash 值 映射 到 内 存 地 址 ， 直 接 取得 Key 所 对 应 的 数据 。 


在 HashMap 中 ， 底 层 数据 结构 使 用 的 是 数组 ， 所 谓 的 内 存 地 址 即 数 组 
的 下 标 索 引 。 总 的 来 说 ， 除 了 非 同 步 和 允许 使 用 Null，HashMap 类 与 
Hashtable 大 致 相同 。 

HashMap 实 际 上 是 一 个 链表 的 数组 。 基 于 HashMap 的 链表 方式 实现 
机 制 ， 只 要 hashCode () 和 hash O 方法 实现 得 足够 好 ， 能 够 尽 可 能 地 
减少 冲突 的 产生 ， 那 么 对 HashMap 的 操作 几乎 等 价 于 对 数组 的 随机 访 
问 操作 ， 具 有 很 好 的 性 能 。 但 是 ， 如 果 hashCode () 或 者 hash () 方法 
实现 较 差 ， 在 大 量 冲突 产生 的 情况 下 ， 那 么 HashMap 事 实 上 就 退化 为 
几 个 链表 ， 对 HashMap 的 操作 等 价 于 遍历 链表 ， 此 时 性 能 很 差 。 

HashMap 的 一 个 功能 缺点 是 它 的 无 序 性 ， 即 被 存 入 到 HashMap 中 的 
元 素 ， 在 遍历 HashMap 时 ， 其 输出 是 无 序 的 。 如 果 和 希望 元 素 保持 输入 
的 顺序 ， 可 以 使 用 LinkedHashMap 蔡 代 。 

HashMap 采 用 一 种 所 谓 的 “Hash 算 法 ”来 决定 每 个 元 素 的 存储 位 置 。 

当 程 序 试图 将 多 个 key-value 放 入 HashMap 中 时 ， 如 代码 清单 3-45 所 
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代码 清单 3-45 HashMap 初始 化 示例 
HashMap<String , Double? map = new HashMap<String , Double>(); 
map.put("xiao ming" , 80.0); 
map.put("xiao hong" , 89.0); 
map.put ("xiao hua" , 78.2); 


当 程 序 执行 map.put (" xiao ming", 80.0) ; 时 ， 系 统 将 调用 " 
xiao ming ”的 hashCode () 方法 得 到 其 hashCode 值 一 每 个 Java 对 象 都 
有 hashCode () 方法 ， 都 可 通过 该 方法 获得 它 的 hashCode 值 。 当 我 们 
得 到 这 个 对 象 的 hashCode 值 之 后 ， 系 统 会 根据 该 hashCode 值 来 决定 该 
元 素 的 存储 位 置 。 

我 们 来 看 一 下 HashMap 源 代码 中 的 put (K key, V value) 方式 ， 代 
码 如 清单 3-46 所 示 。 


代码 清单 3-46 HashMap 源 代码 
public V put(K key, V value) 
{ 
// 如 果 key A null, 调用 putForNullkey 方法 进行 处 理 
if (key == null) 
return putForNullKey (value); 
// 根据 key 的 keyCode 计算 Hash 值 
int hash = hash(key.hashCode()) ; 
// 搜索 指定 hash 值 在 对 应 table 中 的 索引 
int i = indexFor(hash, table.length); 
// wR i 索引 处 的 Entry 不 为 nul1， 通 过 循环 不 断 遍 历 e 元 素 的 下 一 个 元 素 
for (Entry<K,V> e = table[i]; e != null; e = e.next) 
{ 
Object k; 
// 找到 指定 key 与 需要 放 入 的 key WF (hash 值 相同 
// 通过 equals 比较 放 回 true) 
if (e.hash == hash && ((k = e.key) == key 
|| key.equals(k))) 


V oldValue = e.value; 
e.value = value; 
e.recordAccess (this); 


return oldValue; 


} 

// Ri 索引 处 的 Entry 为 nu11， 表 明 此 处 还 没有 Entry 
modCount++; 

// 将 key, value 添加 到 i 索引 处 

addEntry(hash, key, value, i); 


return null; 


清单 3-46 代 码 调用 了 一 个 hash 方 法 用 于 生成 hash 值 ， 它 是 一 个 纯粹 
的 数学 方法 ， 源 代码 如 清单 3-47 所 示 。 


代码 清单 3-47 HashMap 的 hash 方法 源 代码 
static int hash(int h) 
{ 
h ^= (h >>> 20) ^ (h >>> 12); 
return h ^ (h >>> 7) ^ (h >>> 4); 
} 


对 于 任意 给 定 的 对 象 ， 只 要 它 的 hashCode () 返回 值 相同 ， 那 么 
程序 调用 hash (inth) 方法 所 计算 得 到 的 Hash 码 值 总 是 相同 的 。 接 下 来 
程序 会 调用 indexFor (inth, intlength) 方法 来 计算 该 对 象 应 该 保存 在 
table 数 组 的 哪个 索引 处 。indexFor (inth, intlength) 方法 的 代码 如 清 
单 3-48 所 示 。 


代码 清单 3-48 HashMap 的 indexFor 方 法 源 代码 
Static int indexFor(int h, int length) 
{ 
return h & (length-1); 
} 


这 个 方法 非常 巧妙 ， 它 总 是 通过 h& (table.length-1) 来 得 到 该 对 象 
的 保存 位 置 ， 而 HashMap 底 层 数 组 的 长 度 总 是 2 的 n 次 方 ， 当 length 总 是 
2 的 倍数 时 ，h& (length-1) 是 一 个 非常 巧妙 的 设计 : 假设 h=5， 
length=16 ， 那 么 h&length-1 将 得 到 5; 如 果 h=6 ，length=16 ， 那 么 
h&length-1 将 得 到 6， 如 果 h=15，length=16， 那 么 hg&length-1 将 得 到 15; 
但 是 当 h=16 时 ，length=16 时 ， 那 么 h&length-1 将 得 到 0 了 ; 当 h=17 时 ， 
length=16 时 ， 那 么 h&length-1 是 1， 这 样 保 证 计算 得 到 的 索引 值 总 是 位 
于 table 数 组 的 索引 之 内 。 

根据 上 面 3-46 所 示 的 put 方 法 源 代 码 可 以 看 出 ， 当 程序 试图 将 一 个 
key-value 对 放 入 HashMap 中 时 ， 程 序 首先 根据 该 key 的 hashCode () 返 
回 值 决定 该 Entry 的 存储 位 置 ， 如 果 两 个 Entry 的 key 的 hashCode () 返 


回 值 相 同 ， 那 它们 的 存储 位 置 相 同 。 如 果 这 两 个 Entry 的 key 通 过 equals 
比较 返回 tue， 新 添加 Entry 的 Value 将 履 盖 集合 中 原 有 Entry 的 Value， 但 
key 不 会 被 覆盖 。 如 果 这 两 个 Entry 的 key 通 过 equals 比 较 返 回 false， 新 添 
加 的 Entry 将 与 集合 中 原 有 Entry 形 成 Entry 链 ， 而 且 新 添加 的 Entry 位 于 
Entry 链 的 头 部 。 

当 向 HashMap 中 添加 key-value 对 ， 由 其 key 的 hashCode () 返回 值 
决定 该 key-value 对 〈 就 是 Entry 对 象 ) 的 存储 位 置 。 当 两 个 Entry 对 象 的 
key 的 hashCode () 返回 值 相同 时 ， 将 由 key 通 过 eqauls () 比较 值 决定 
是 采用 覆盖 行为 (返回 true) ， 还 是 产生 Entry 链 (返回 false) o 

清单 3-46 所 示 代 码 中 也 调用 了 addEntry (hash, key, value, i) ; 
方法 ，addEntry 是 HashMap 提 供 的 一 个 包 访 问 权 限 的 方法 ， 该 方法 仅 用 
于 添加 一 个 key-value 对 。 代 码 如 清单 3-49 所 示 。 


代码 清单 3-49 HashMap 的 addEntry 方法 源 代码 
void addEntry(int hash, K key, V value, int bucketIndex) 
| 
// 获取 指定 bucketIndex 索引 处 的 Entry 
// table 是 一 个 普通 数组 ， 每 个 数组 都 有 一 个 固定 的 长 度 ， 这 个 数组 的 长 度 就 是 HashMap 的 容量 。 
Entry<K,V> e = table[bucketIndex]; // 
// 将 新 创建 的 Entry HA bucketIndex 索引 处 ， 并 让 新 的 Entry 指向 原来 的 Entry 
table[bucketIndex] = new Entry<K,V>(hash, key, value, e); 
// Je Map 中 的 key-value 对 的 数量 超过 了 极限 
//Size 变量 用 于 保存 该 HashMap 中 所 包含 的 key-value 对 的 数量 。 
//threshold 变量 包含 了 HashMap 能 容纳 的 key-value 对 的 极限 ， 它 的 值 等 于 HashMap HATH 
以 负载 因子 (load factor), 
// 当 sizet+>= threshold 时 ，HashMap 会 自动 调用 resize 方法 扩充 HashMap 的 容量 。 每 扩充 
一 次 ，HashMap 的 容量 就 增 大 一 信 。 
if (Size++ >= threshold) 
// 把 table 对 象 的 长 度 扩充 到 2 倍 
resize(2 * table.length); 


系统 总 是 将 新 添加 的 Entry 对 象 放 入 table 数 组 的 bucketIndex 索 引 
处 ， 如 果 bucketIndex 索 引 处 已 经 有 了 一 个 Entry 对 象 ， 那 新 添加 的 Entry 
对 象 指向 原 有 的 Entry 对 象 (产生 一 个 Entry 链 ) ， 如 果 bucketIndex 索 引 
处 没有 Entry 对 象 ， 那 么 通过 代码 Entry < K, V > e-table[bucketIndex]; 
确保 e 变 量 是 null， 也 就 是 新 放 入 的 Entry 对 象 指向 Nul， 也 就 是 没有 产 
生 Entry 链 。 

当 HashMap 的 每 个 bucket 里 存储 的 Entry 只 是 单个 Entry， 也 就 是 没 
有 通过 指针 产生 Entry 链 时 ， 此 时 的 HashMap 具 有 最 好 的 性 能 。 当 程序 
通过 key 取 出 对 应 value 时 ， 系 统 只 要 先 计 算出 该 key 的 hashCode () 返 
回 值 ， 再 根据 该 hashCode 返 回 值 找 出 该 key 在 table 数 组 中 的 索引 ， 然 后 
取出 该 索引 处 的 Entry， 最 后 返回 该 key 对 应 的 value 即 可 。HashMap 类 的 
get (K key) 方法 代码 如 清单 3-50 所 示 。 


代码 清单 3-50 HashMap 的 get 方法 源 代码 
public V get (Object key) 
{ 
// Je key X null, 调用 getForNullKey 取出 对 应 的 value 
if (key == null) 
return getForNullKey(); 
// 根据 该 key 的 hashCode 值 计算 它 的 hash 码 
int hash = hash(key.hashCode ()) ; 
// 直接 取出 table 数组 中 指定 索引 处 的 值 ， 
for (Entry<K,V> e = table[indexFor(hash, table.length)]; 


e != null; 
// 搜索 该 Entry 链 的 下 一 个 Entr 
e = e.next) // Q 
{ 
Object k; 


// RE Entry 的 key 与 被 搜索 key 相同 
if (e.hash == hash && ((k = e.key) == key 
|| key.equals(k)]) 
return e.value; 
} 
return null; 


} 


如 果 HashMap 的 每 个 bucket 里 只 有 一 个 Entry 时 ，HashMap 可 以 根据 
索引 、 快 速 地 取出 该 bucket 里 的 Entry。 在 发 生 “Hash 冲 突 ” 的 情况 下 ， 
单个 bucket 里 存储 的 不 是 一 个 Entry， 而 是 一 个 Entry 链 ， 系 统 只 能 必须 
按 顺序 遍历 每 个 Entry， 直 到 找到 想 搜 索 的 Entry 为 止 一 如 果 恰 好 要 搜索 
的 Entry 位 于 该 Entry 链 的 最 末端 《该 Entry 是 最 早 放 入 该 bucket 中 ) ， 那 
系统 必须 循环 到 最 后 才能 找到 该 元 素 。 

归纳 起 来 简单 地 说 ，HashMap 在 底层 将 key-value 当 成 一 个 整体 进行 
处 理 ， 这 个 整体 就 是 一 个 Entry 对 象 。HashMap 底 层 采 用 一 个 Entry[] 数 
组 来 保存 所 有 的 key-value 对 ， 当 需要 存储 一 个 Entry 对 象 时 ， 会 根据 


Hash 算 法 来 决定 其 存储 位 置 ; 当 需 要 取出 一 个 Entry 时 ， 也 会 根据 Hash 
算法 找到 其 存储 位 置 ， 直 接 取 出 该 Entry。 

当 创 建 HashMap 时 ， 有 一 个 默认 的 负载 因子 (load factor) ， 其 默 
认 值 为 0.75， 这 是 时 间 和 空间 成 本 上 一 种 折 中 ， 增 大 负载 因子 可 以 减少 
Hash 表 (就 是 那个 Entry 数 组 ) 所 占用 的 内 存 空间 ， 但 会 增加 查询 数据 
的 时 间 开 销 ， 而 查询 是 最 频繁 的 操作 (HashMap 的 get () 与 put O A 
法 都 要 用 到 查询 ) ; 减 小 负载 因子 会 提高 数据 查询 的 性 能 ， 但 会 增加 
Hash 表 所 占用 的 内 存 空间 。 

综 上 所 述 ， 我 们 可 以 在 创建 HashMap 时 根据 实际 需要 适当 地 调整 
load factor 的 值 ， 如 果 程 序 比较 关心 空间 开销 、 内 存 比较 紧张 ， 可 以 适 
当地 增加 负载 因子 ， 如 果 程 序 比较 关心 时 间 开 销 ， 内 存 比 较 宽 裕 则 可 
以 适当 的 减少 负载 因子 。 通 常情 况 下 ， 程 序 员 无 须 改 变 负载 因子 的 
值 。 

如 果 开 始 就 知道 HashMap 会 保存 多 个 key-value 对 ， 可 以 在 创建 时 就 
使 用 较 大 的 初始 化 容量 ， 如 果 HashMap 中 Entry 的 数量 一 直 不 会 超过 极 
限 容量 (capacity*load factor) ，HashMap 就 无 须 调 用 resize () 方法 重 
新 分 配 table 数 组 ， 从 而 保证 较 好 的 性 能 。 当 然 ， 开 始 就 将 初始 容量 设 
置 太 高 可 能 会 浪费 空间 (系统 需要 创建 一 个 长 度 为 capacity 的 Entry 数 
组 ) ， 因 此 创建 HashMap 时 初始 化 容量 设置 也 需要 小 心 对 待 。 

从 上 面 的 源 代码 分 析 可 以 得 出 ，HashMap 的 高 性 能 需要 以 下 3 点 来 
提供 保证 。 

(1) 提供 高 效 的 Hash 算 法 ; 

(2) 提供 高 效 的 算法 ， 保 证 Hash 值 到 内 存 地 址 (数组 索引 ) AYER 
射 速 度 ; 

(3) 根据 内 存 地 址 〈 数 组 索引 ) 可 以 直接 取得 对 应 的 值 。 

此 外 ， 能 够 不 用 Map 就 不 要 用 了 吧 ， 当 我 们 想 遍 历 一 个 用 键 值 对 形 
式 保 存 的 Map 时 ， 下 面 两 种 方式 其 实效 率 都 不 高 ， 如 清单 3-51 所 示 。 


代码 清单 351 map 循环 代码 
for (K key : map.keySet()) { 
V value : map.get (key); 
} 
for (Entry«K, V» entry : map.entrySet()) | 
K key = entry.getKey() ; 
V value = entry.getValue(); 


3.2.6 EnumSet, EnumMap 


我 们 用 到 类 似 枚 举 (enum-like) 结构 的 键 值 时 ， 就 应 该 考虑 将 这 
些 键 值 用 声明 为 枚 举 类 型 ， 并 将 之 作为 EnumMap 键 。 在 某 些 情况 下 ， 
比如 在 使 用 配置 Map 时 ， 我 们 可 能 会 预先 知道 保存 在 Map 中 键 值 。 如 果 
这 个 键 值 非常 小 ， 我 们 就 应 该 考虑 使 用 EnumSet 或 EnumMap， 而 并 非 
使 用 我 们 常用 的 HashSet 或 HashMap。 

EnumSet 是 一 个 与 枚 举 类 型 一 起 使 用 的 专用 Set 实 现 。 枚 举 Set 中 所 
有 元 素 都 必须 来 自 单个 枚 举 类 型 〈 即 必须 是 同类 型 ， 且 该 类 型 是 Enum 
的 子 类 ) 。 枚 举 类 型 在 创建 Set 时 显 式 或 隐 式 地 指定 。 枚 举 Set 在 内 部 表 
示 为 位 向 量 。 此 表示 形式 非常 紧凑 且 高 效 。 此 类 的 空间 和 时 间 性 能 应 
该 很 好 ， 足 以 用 作 传 统 上 基于 int 的 “位 标志 ”的 替换 形式 ， 具 有 高 品 
质 、 类 型 安全 的 优势 。 像 大 多 数 Collection 一 样 ，EnumSet 是 不 同步 的 。 
如 果 指 定 的 Collection 也 是 一 个 枚 举 Set， 则 批量 操作 (如 containsAll 和 
retainAll) 也 应 该 运行 得 非常 快 。 由 iterator 方 法 返回 的 迭代 器 按 其 自然 
顺序 遍历 这 些 元 素 〈 该 顺序 是 声明 枚 举 常量 的 顺序 ) 。iterator 方 法 返 
回 的 迭代 器 是 弱 一 致 的 ， 即 它 从 不 抛 出 ConcurrentModificationException 
异常 ， 也 不 一 定 显示 在 和 迭代 进行 时 发 生 的 任何 Set 修 改 的 效果 。 
EnumSsSet 不 允许 使 用 Nul 元 素 ， 如 果 你 试图 插入 Nul 元 素 将 抛 出 
NullPointerException 异 常 。 

EnumMap 是 专门 为 枚 举 类 型 量 身 定做 的 Map 实 现 。 昌 然 使 用 其 他 
的 Map 实 现 (HashMap) 也 能 完成 枚 举 类 型 实例 到 值得 映射 ， 但 是 使 
用 EnumMap 会 更 加 高 效 ， 它 只 能 接收 同一 枚 举 类 型 的 实例 作为 键 值 ， 


并 且 由 于 枚 举 类 型 实例 的 数量 相对 固定 并 且 有 限 ， 所 以 EnumMap 使 用 
数组 来 存放 与 枚 举 类 型 对 应 的 值 。 这 使 得 EnumMap 的 效率 非常 高 。 
EnumMap 在 内 部 使 用 枚 举 类 型 的 ordinal () 得 到 当前 实例 的 声明 次 
序 ， 并 使 用 这 个 次 序 维护 枚 举 类 型 实例 对 应 值 在 数组 的 位 置 。 在 实际 
使 用 中 ，EnumMap 对 象 往往 是 由 外 部 负责 整个 应 用 初始 化 的 代码 来 填 
充 的 。 

EnumSet 的 源 代码 实现 如 清单 3-52 所 示 。 


代码 清单 3-52 EnumSet 源 代码 实现 


private transient Object[] vals; 


public V put(K key, V value) { 
E at 
int index - key.ordinal(); 
vals[index] = maskNull (value); 
HE ia 

} 


上 段 代码 的 关键 实现 在 于 ， 我 们 用 数组 代替 了 哈 希 表 。 尤 其 是 向 
Map 中 插入 新 值 时 ， 所 要 做 的 仅仅 是 获得 一 个 由 编译 器 为 每 个 枚 举 类 型 
生成 的 常量 序列 号 。 虽 然 使 用 其 他 的 Map 实 现 (如 HashMap) 也 能 完 
枚 举 类 型 实例 到 值得 映射 ， 但 是 使 用 EnumMap 会 更 加 高 效 。 如 果 有 一 
个 全 局 的 Map 配 置 (例如 只 有 一 个 实例 ) ， 在 增加 访问 速度 的 压力 下 ， 
EnumMap 会 获得 比 HashMap 更 加 出 色 的 性 能 。 原 因 在 于 EnumMap 使 用 
的 堆 内 存 比 HashMap 要 少 一 位 (bit) ， 而 且 HashMap 要 在 每 个 键 值 上 都 
要 调用 hashCode () 方法 和 equals () 方法 。 

注意 ， 在 不 能 使 用 EnumMap 的 时 候 ， 至 少 也 要 优化 HashMap 的 
hashCode () lequals () 方法 。 一 个 好 的 hashCode O 方法 是 很 有 必 
要 的 ， 因 为 它 能 防止 对 高 开销 equals 0 方法 多 余 的 调用 。 


3.2.7 HashSet 使 用 经 验 


总 的 来 说 ，HashSet 和 HashMap 之 间 有 很 多 相似 之 处 。 前 面 讲 过 ， 
对 于 HashMap 而 言 ， 系 统 把 key-value 当 成 一 个 整体 进行 处 理 ， 系 统 总 是 
根据 Hash 算 法 来 计算 key-value 的 存储 位 置 ， 这 样 可 以 保证 能 快速 存 、 
取 Map 的 key-value 对 。 对 于 HashSet 而 言 ， 系 统 采 用 Hash 算 法 决定 集合 
元 素 的 存储 位 置 ， 这 样 可 以 保证 能 快速 存 、 取 集合 元 素 。 

HashSet 的 源 代码 如 代码 清单 3-53 所 示 。 


代码 清单 3-53 HashSet FRE 
public class HashSet<E> 
extends AbstractSet<E> 
implements Set<E>, Cloneable, java.io.Serializable 
{ 
// 使 用 HashMap 4 key 保存 HashSet PAA LE 


private transient HashMap<E,Object> map; 
// 定义 一 个 虚拟 的 Object 对 象 作 为 HashMap 的 value 
private static final Object PRESENT = new Object(); 


// 初始 化 HashSet， 底 层 会 初始 化 一 个 HashMap 
public HashSet () 
{ 
map = new HashMap<E, Object>(); 
} 
// 以 指定 的 initialCapacity, loadFactor 创建 HashSet 
// 其 实 就 是 以 相应 的 参数 创建 HashMap 
public HashSet (int initialCapacity, float loadFactor) 
{ 
map = new HashMap<E,Object> (initialCapacity, loadFactor); 
} 
public HashSet (int initialCapacity) 
{ 
map = new HashMap<E,Object> (initialCapacity); 
} 
HashSet(int initialCapacity, float loadFactor, boolean dummy) 
{ 
map = new LinkedHashMap<E, Object>(initialCapacity 
, loadFactor); 
} 
// 调用 map 的 keySet 来 返回 所 有 的 key 
public Iterator<E> iterator() 
{ 
return map.keySet().iterator(); 
} 
// 调用 HashMap 的 size() 方法 返回 Entry 的 数量 ， 就 得 到 该 set 里 元 素 的 个 数 
public int size() 
{ 
return map.size(); 
} 
// 调用 HashMap 的 isEmpty() 判断 该 HashSet 是 否 为 空 ， 
// 当 HashMap 为 空 时 ， 对 应 的 HashSet 也 为 空 
public boolean isEmpty () 
{ 
return map.isEmpty(); 
) 
// 调用 HashMap 的 containsKey 判断 是 否 包含 指定 key 
//HashSet 的 所 有 元 素 就 是 通过 HashMap 的 key 来 保存 的 
public boolean contains (Object o) 
{ 
return map.containsKey (o); 
) 
// 将 指定 元 素 放 入 HashSet 中 ， 也 就 是 将 该 元 素 作 为 key XA HashMap 
public boolean add(E e) 


{ 
return map.put(e, PRESENT) == null; 
} 
// 调用 HashMap 的 remove 方法 删除 指定 Entry， 也 就 删除 了 HashSet 中 对 应 的 元 素 
public boolean remove (Object o) 
{ 
return map. remove (0) ==PRESENT; 
} 
// 调用 Map 的 clear 方法 清空 所 有 Entry， 也 就 清空 了 HashSet 中 所 有 元 素 
public void clear() 
{ 
map.clear(); 
} 
} 


从 上 面 的 源 程序 可 以 看 出 ，HashSet 的 实现 其 实 非 常 简单 ， 它 只 是 


封 狼 了 一 个 HashMap 对 象 来 存储 所 有 的 集合 元 素 ， 所 有 放 入 HashSet 中 
的 集合 元 素 实际 上 由 HashMap 的 key 来 保存 ， 而 HashMap 的 value 则 存储 
了 一 个 PRESENT， 它 是 一 个 静态 的 Object 对 象 。HashSet 的 绝 大 部 分 方 
法 都 是 通过 调用 HashMap 的 方法 来 实现 的 ， 因 此 HashSet 和 HashMap 两 


个 集合 在 实现 本 质 上 是 相同 的 。 


我 们 来 看 一 个 例子 ， 代 码 清单 3-54 壮 示 了 HashSet 的 应 用 。 


代码 清单 3.54 HashSet 应 用 
import java.util.HashSet; 


import java.util.Set; 


public class testHashTable { 
public static void main(String[] args) 
{ 
Set<Name> s = new HashSet«Name» () ; 
s.add(new Name ("mingyao", "zhou")); 


System.out.println(s.contains (new Name("mingyao", "zhou"))); 


class Name 
{ 
private String first; 


private String last; 


public Name (String first, String last) 
{ 

this.first = first; 

this.last = last; 


public boolean equals (Object o) 
{ 
if (this == o) 
{ 
return true; 


} 


if (o.getClass() == Name.class) 
{ 

Name n = (Name)o; 

return n.first.equals(first)&& n.last.equals (last); 
} 


return false; 


} 


代码 清单 3-54 的 运行 结果 是 false。 程 序 中 向 HashSet 里 添加 了 一 
Ñ new Name (" mingyao" , "zhou") 对 象 之 后 ， 立 即 通过 程序 判 
断 该 HashSet 是 否 包含 一 个 new Name (" mingyao " , " zhou ") 对 
象 。 粗 看 上 去 ， 很 容易 以 为 该 程序 会 输出 true。 实 际 运行 程序 将 看 到 程 
序 输出 false， 这 是 因为 HashSet 判 断 两 个 对 象 相等 的 标准 除了 要 求 通过 
equals () 方法 比较 返回 true 之 外 ， 还 要 求 两 个 对 象 的 hashCode () 返 
回 值 相 等 。 而 上 面 程序 没有 重 写 Name 类 的 hashCode () 方法 ， 两 个 
Name 对 象 的 hashCode () 返回 值 并 不 相同 ， 因 此 HashSet 会 把 它们 当 
成 两 个 对 象 处 理 ， 因 此 程序 返回 false。 由 此 可 见 ， 当 我 们 试图 把 某 个 
类 的 对 象 当 成 HashMap 的 key， 或 试图 将 这 个 类 的 对 象 放 入 HashSet 中 保 
存 时 ， 重 写 该 类 的 equals (Object obj) 方法 和 hashCode () 方法 很 重 
要 ， 而 且 这 两 个 方法 的 返回 值 必须 保持 一 致 。 当 该 类 的 两 个 hashCode 
() 返回 值 相同 时 ， 它 们 通过 equals () 方法 比较 也 应 该 返回 true。 通 
常 来 说 ， 所 有 参与 计算 hashCode () 返回 值 的 关键 属性 ， 都 应 该 用 于 
作为 equals () 比较 的 标准 。 


代码 清单 3-55 重 写 了 equals () 方法 和 hashcode () 方法 ， 
输出 是 true 了 。 


代码 清单 3-55 HashSet MA 
import java.util.HashSet; 


import java.util.Set; 


public class testHashTable { 
public static void main(String[] args) 
{ 
Set<Name> s = new HashSet«Name» () ; 
s.add(new Name ("mingyao", "zhou")); 


System.out.println(s.contains (new Name("mingyao", "zhou"))); 


class Name 
{ 
private String first; 


private String last; 


public Name(String first, String last) 


{ 
this. first = first; 
this.last = last; 


// 根据 first 判断 两 个 Name 是 否 相 等 
public boolean equals (Object o) 
{ 


if (this == 0) 


return true; 


if (o.getClass() == Name.class) 


Name n = (Name)o; 

return n.first.equals (first); 
} 
return false; 


} 

// 根据 first 计算 Name HRW hashCode() BOA 
public int hashCode () 

{ 


return first.hashCode(); 


public String toString () 
{ 


return "Name[first-" + first + ", last-" + last + "]"; 


上 面 程 序 中 提供 了 一 个 Name 类 ， 该 Name 类 重 写 了 equals () 、 
hashCode () 、toString () 三 个 方法 ， 这 两 个 方法 都 是 根据 Name 类 的 
first 实 例 变 量 来 判断 的 ， 当 两 个 Name 对 象 的 first 实 例 变量 相等 时 ， 这 两 
个 Name 对 象 的 hashCode () 返回 值 也 相同 ， 通 过 equals () 比较 也 会 
返回 true。 程 序 main 了 因数 先 将 第 一 个 Name 对 象 添 加 到 HashSet 中 ， 该 
Name 对 象 的 first 实 例 变 量 值 为 ”abc ”， 接 着 程序 再 次 试图 将 一 个 first 
A" abc " 的 Name 对 象 添 加 到 HashSet 中 ， 很 明显 ， 此 时 没 法 将 新 的 
Name 对 象 添加 到 该 HashSet 中 ， 因 为 此 处 试图 添加 的 Name 对 象 的 first 也 
x= abc", HashSet 会 判断 此 处 新 增 的 Name 对 象 与 原 有 的 Name 对 象 
相同 ， 因 此 无 法 添加 进入 ， 程 序 输出 set 集 合 时 将 看 到 该 集合 里 只 包含 
一 个 Name 对 象 ， 就 是 第 一 个 、last 为 “123“ 的 Name 对 象 。 


3.2.8 LinkedHashMap, TreeMaplb3% 


LinkedHashMap 247K B HashMap, ， 同 时 在 HashMap 的 基础 上 又 在 内 
部 增加 了 一 个 链表 ， 用 以 存放 元 素 的 顺序 ， 所 以 它 的 性 能 整体 较 快 。 

HashMap 通 过 hash 算 法 可 以 最 快速 地 进行 put () 和 get O 操作 。 
TreeMap 则 提供 了 一 种 完全 不 同 的 Map 实 现 。 从 功能 上 讲 ，TreeMap 有 
着 比 HashMap 更 为 强大 的 功能 ， 它 实现 了 SortedMap 接 口 ， 这 意味 着 它 
可 以 对 元 素 进 行 排 序 。TreeMap 的 性 能 略微 低 于 HashMap。 如 果 在 开发 
中 需要 对 元 素 进行 排序 ， 那 么 使 用 HashMap 便 无 法 实现 这 种 功能 ， 使 
用 TreeMap 的 迭代 输出 将 会 以 元 素 顺序 进行 。LinkedHashMap 是 基于 元 
素 进 入 集合 的 顺序 或 者 被 访问 的 先后 顺序 排序 ，TreeMap 则 是 基于 元 素 
的 固有 顺序 (由 Comparator 或 者 Comparable 人 确定 ) o 

LinkedHashMap 是 根据 元 素 增加 或 者 访问 的 先后 顺序 进行 排序 ， 而 
TreeMap 则 根据 元 素 的 key 进 行 排序 。 


代码 清单 3-56 所 示 实 例 演示 了 使 用 TreeMap 实 现 业 务 逻 辑 的 排序 。 


代码 清单 3-56 TreeMap 应 用 
import java.util.Iterator; 
import java.util.Map; 


import java.util.TreeMap; 
public class Student implements Comparable<Student>{ 


public String name; 

public int score; 

public Student (String name,int score) { 
this.name - name; 


this.score - score; 


@Override 
/ | &ift TreeMap 如 何 排序 
public int compareTo(Student o) ( 
// TODO Auto-generated method stub 
if (o.score<this.score) { 
return 1; 
Jelse if (o.score>this.score) { 
return -1; 
) 


return 0; 


@Override 
public String toString() { 
StringBuffer sb = new StringBuffer (); 
sb.append ("name:") ; 
sb.append (name) ; 
sb.append(" "); 
sb.append ("score:"); 
sb.append (score); 


return sb.toString(); 


public static void main(String[] args) { 


TreeMap map = new TreeMap(); 

Student sl = new Student ("1",100); 
Student s2 new Student ("2",99); 
Student s3 new Student("3",97); 
Student s4 = new Student("4",91); 
map.put(sl, new StudentDetailInfo(s1)); 


map.put(s2, new StudentDetailInfo(s2)); 
map.put(s3, new StudentDetailInfo(s3)); 
map.put(s4, new StudentDetailInfo(s4)); 


// 打 印 分 数位 于 S4 和 S2 之 间 的 人 

Map mapl-((TreeMap)map).subMap(s4, s2); 

for (Iterator iterator-mapl.keySet().iterator();iterator.hasNext();)( 
Student key = (Student)iterator.next(); 
System.out.println (key+"->"+map.get (key)); 

} 

System.out.println("subMap end"); 


// 打 印 分 数 比 sl 低 的 人 

mapl=( (TreeMap)map) .headMap (s1); 

for (Iterator iterator-mapl.keySet().iterator();iterator.hasNext();)( 
Student key = (Student)iterator.next(); 
System.out .println (key+"->"+map.get (key)); 

} 

System.out.println("subMap end"); 


// 打 印 分 数 比 sl 高 的 人 

mapl-((TreeMap)map).tailMap(s1); 

for (Iterator iterator=mapl.keySet().iterator();iterator.hasNext ();) { 
Student key = (Student) iterator.next (); 
System.out.println(key+"->"+map.get (key) ); 

} 

System.out.println("subMap end"); 


class StudentDetailInfo( 
Student s; 
public StudentDetailInfo(Student s) { 
this.s = S; 
) 
@Override 
public String toString () { 


return s.name + "'s detail information"; 


代码 3-56 程 序 运行 后 的 输出 如 代码 清单 3-57 所 示 。 


代码 清单 3-57 3-56 代码 运行 输出 

name:4 score:91->4's detail information 
name:3 score:97->3's detail information 
subMap end 

name:4 score:91-»4's detail information 
name:3 score:97->3's detail information 
name:2 score:99->2's detail information 
subMap end 

name:l score:100->1's detail information 


subMap end 


3.2.9 集合 处 理 优化 新 方案 


编程 语言 一 般 都 需要 提供 一 种 机 制 遍 历 软 件 对 象 的 集合 ， 现 代 的 
编程 语言 支持 更 为 复杂 的 数据 结构 ， 如 列表 、 集 合 、 映 射 和 数 。 遍 历 
能 力 是 通过 公共 方法 提供 ， 而 内 部 细节 都 隐藏 在 类 的 私有 部 分 ， 所 以 
程序 员 不 需要 了 解 其 内 部 实现 就 能 够 遍历 这 些 数据 结构 中 的 元 素 ， 这 
就 是 迭代 的 目的 。 达 代 器 是 对 集合 中 的 所 有 元 素 进行 顺 序 访问 并 可 以 
对 每 个 元 素 执行 某 些 操作 的 机 制 。 连 代 器 在 本 质 上 提供 了 在 封装 的 对 
象 集合 上 做 “循环 ”的 装置 。 

常见 的 使 用 迭代 器 的 例子 有 : 

(1) 访问 目录 中 的 每 个 文件 并 显示 文件 名 。 

(2) 访问 队列 中 的 每 个 客户 〈 如 银行 排队 ) 并 判断 用 户 等 待 了 多 
久 。 使 用 欠 代 器 时 ， 一 般 情况 下 可 以 循环 能 套 ， 即 可 以 在 同一 时 间 做 
2T s. 

(3) 迭代 器 应 该 是 无 损 的 ， 即 迭代 行为 不 应 该 改变 集合 本 身 ， 如 
迭代 时 不 要 从 集合 中 移 除 或 插入 元 素 。 

(4) 在 某 些 情况 下 ， 你 需要 使 用 迭代 器 的 不 同人 遍历 方 法 ， 例 如， 
树 的 前 序 遍 历 和 后 序 遍 历 ， 


或 者 深度 优先 、 广 度 优先 遍历 。 

迭代 器 模式 

迭代 器 设计 模式 是 一 种 行为 模式 ， 其 核心 思想 是 负责 访问 和 遍历 
列表 中 的 对 象 ， 并 把 这 些 对 象 放 到 一 个 迭代 器 对 象 中 。 和 迭代 器 的 实现 
方法 根据 谁 来 控制 迭代 分 为 两 种 : EARME ER. EMRE 
是 由 客户 程序 创建 迭代 器 ， 调 用 next O 行进 到 下 一 个 元 素 ， 测 试 查看 
是 否 所 有 元 素 已 被 访问 。 被 动 迭 代 器 是 Java8 新 引入 的 机 制 ， 它 是 迭代 
器 本 身 控制 迭代 ， 即 迭代 器 自行 next () ARE, HWE AER RIA 
代 是 透明 的 ， 是 不 能 操作 的 。 这 种 方法 在 LISP 语 言 中 很 常见 。 

GOF[5] 给 出 的 定义 是 ， 在 不 暴露 该 对 象 的 内 部 细节 前 提 下 ， 通 过 
提供 一 种 方法 用 于 访问 一 个 容器 (container) 对 象 中 各 个 元 素 。 深 层次 
的 目的 是 为 了 把 遍历 算法 从 容器 对 象 中 独立 出 来 ， 算 法 如 果 和 应 用 高 
度 耦 合 ， 那 最 终 会 完全 曲解 了 算法 的 发 展 方 向 ， 最 终 导致 算法 和 数据 
SHARES, 

面向 对 象 设 计 的 一 大 难点 是 如 何 正 确 辨认 对 象 的 职责 。 理 想 状态 
下 ,一 个 类 应 该 只 有 一 个 单一 的 职责 [7]。 职 责 分 离 可 以 最 大 限度 地 去 
除 对 象 之 间 的 耦合 程度 ， 但 是 实际 开发 过 程 中 ， 想 要 做 到 职责 单一 着 
实 不 易 。 具 体 到 本 模式 ， 以 迭代 器 模式 为 例 ， 容 器 对 象 提 供 了 两 个 职 
责 ， 一 是 组 织 管理 数据 对 象 ， 二 是 提供 遍历 算法 。 所 以 Iterator 模 式 就 
是 分 离 了 集合 对 象 的 遍历 行为 ， 抽 象 出 一 个 迭代 器 类 来 负责 ， 这 样 既 
可 以 做 到 不 暴露 集合 的 内 部 结构 ， 又 可 让 外 部 代码 透明 地 访问 集合 内 
部 的 数据 。 

迭代 器 模式 由 以 下 几 个 角色 组 成 : 

mikes (Iterator) : 迭代 器 角色 负责 定义 访问 和 遍历 元 素 的 
接口 。 

四 具体 迭代 器 角色 (Concrete Iterator) : 具体 迭代 器 角色 要 实现 迭 
代 器 接口 ， 并 要 记录 遍历 中 的 当前 位 置 。 

m 容器 角色 (Container) : 容器 角色 负责 提供 创建 具体 迭代 器 角色 
的 接口 。 

m 具体 容器 角色 (Concrete Container) : 具体 容器 角色 实现 创建 具 
体 迭 代 器 角色 的 接口 ， 这 个 


具体 迭代 器 角色 与 该 容器 的 结构 相关 。 
迭代 器 模式 的 类 图 如 图 3-1 所 示 。 
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图 3-1 迭代 器 模式 类 图 
从 上 面 的 图 可 以 看 出 ， 在 JDK 内 部 ， 与 迭代 器 相关 的 接口 有 两 个 
Iterator, Iterable。 Iterator 及 其 子 类 通常 是 迭代 器 本 身 的 结构 与 方法 。 
Iterable 是 可 迭代 的 ， 如 AbstractList HashMap 等 需要 使 用 迭代 器 功能 的 
类 ， 都 需要 实现 该 接口 。 下 面 介绍 Iterator 和 Iterable 两 个 接口 的 源码 。 
Iterator 如 清单 3-58 所 示 。 


代码 清单 3-58 lterator 源 代码 
public interface Iterator<E> { 
boolean hasNext (); 
E next (); 
void remove () 


} 
Iterable 如 代码 清单 3-59 所 示 。 


代码 清单 3-59 lterable 源 代码 
public interface Iterable<T> { 
Iterator<T> iterator(); 


} 


实际 应 用 过 程 中 ， 我 们 如 何 来 使 用 迭代 器 呢 ? 
(1) 比如 类 A 想 要 使 用 迭代 器 ， 它 的 类 声明 部 分 应 该 是 class A 


implement Iterable; 


(2) 在 类 A 实现 中 ， 要 实现 Iterable 接 口中 的 唯一 方法 : Iterator < T 
> iterator () ; 这 个 方法 用 于 返回 一 个 迭代 器 ， 即 Iterator 接 口 及 其 子 


X; 


(3) 在 类 A 中 ， 定 义 一 个 内 部 类 S$， 专 门 用 于 实现 Iterator 接 口 ， 定 
制 类 A 自己 的 迭代 器 实现 。 
具体 实现 代码 如 下 所 清单 3-60 所 示 。 


代码 清单 3-60 ”定制 先 代 器 类 实现 
class iteImplemtion implement Iterable 
{ 
Iterator<T> iterator() {...} 
class S implement Iterator<E> 
{ 
boolean hasNext() {....} 
E next() {....} 


void remove() {....} 


} 


Lambda 表 达 式 


Java8 引 入 了 独特 的 Lambda 表 达 式 用 于 遍历 集合 。Lambda 表 达 式 本 
质 上 是 一 个 匿名 方法 ， 我 们 来 看 下 面 这 个 例子 。 


代码 清单 3-61 add 方法 
public int add(int x, int y) { 
return x * y; 


} 


转 成 Lambda 表 达 式 后 就 变 成 (intx, inty) ->xty; 这 一 行 表达 
式 。 人 参数 类 型 可 以 省 略 ，Java 编 译 器 会 根据 上 下 文 推断 出 来 : 
(x, y) ->xty; /返回 两 数 之 和 
或 者 
(x, y) -> (fretum x+y; }/ 显 式 指 明 返 回 值 
可 见 Lambda 表 达 式 由 三 部 分 组 成 : 参数 列表 ， 箭 头 (>) , UM 
一 个 表达 式 或 语句 块 。 
下 面 这 个 例子 里 的 Lambda 表 达 式 没有 参数 ， 也 没有 返回 值 ， 即 相 
当 于 一 个 方法 接受 0 个 参数 ， 返 回 void，JDK 里 Runnable 接 口 的 run 方 法 
就 是 这 样 一 个 实现 。 
()- > (System.out.println( " Hello Lambda! " );) 
如 果 只 有 一 个 参数 且 可 以 被 Java 推 断 出 类 型 ， 那 么 参数 列表 的 括号 
也 可 以 省 略 : 
c- > {return c.size(); } 


Javal.0 和 1.1 种 两 个 主要 的 集合 类 是 Vector 和 Hashtable， 迭 代 器 是 通 
过 一 个 叫 作 枚 举 的 类 实现 的 。 今 天 无 论 是 Vector 还 是 Hashtable 都 是 泛 型 
类 ， 但 退回 到 那 时 泛 型 还 不 是 Java 语 言 的 一 部 分 ， 泛 型 是 在 JDK5 的 时 
候 被 引入 的 。 清 单 3-62 所 示 代 码 演示 了 使 用 枚 举 来 处 理 字符 串 向 量 的 方 
法 5 


代码 清单 3-62 ”使 用 枚 举 处 理 字符 串 
Vector names = new Vector () ， 
names. add ("Apple"); 
names . add ("Orange") ; 
Enumeration e - names.elements(); 
while (e.hasMoreElements|()) 
{ 
String name = (String) e.nextElement (); 
System.out.println (name); 


} 


Java8 提 供 了 全 新 的 遍历 对 象 集 合 方式 ， 该 方式 主要 包含 主动 迭 
代 、 流 、 并 行 流 三 种 方法 。 总 的 来 说 ，Java8 提 供 的 迭代 器 较 JDK 早 期 
版 本 而 言 ， 它 的 可 读 性 更 好 、 不 易 出 错 、 更 容易 并 行 化 。 进 入 Java8 的 
新 方式 学 习 之 前 ， 我 们 先 来 回顾 一 下 集合 类 访问 的 变化 过 程 。 

Javal.2 推 出 了 集合 类 (Collections) ， 并 通过 一 个 迭代 器 类 

(Iterator) 实现 了 迭代 器 设计 模式 。 因 为 Javal.2 当 时 还 没有 推出 泛 型 
概念 ， 所 以 我 们 需要 对 迭代 器 返回 的 对 象 进行 强制 类 型 转换 。 对 于 
Javal.2 至 1.4 版 本 ， 遍 历 字 符 串 列表 方式 如 代码 清单 3-63 所 示 。 


代码 清单 3-63 Java1.2 便利 字 答 串 列表 方式 
List names = new Linkedlist(); 
names .add ("Apple"); 
names . add ("Orange") ; 
Iterator i = names.iterator(); 
while (i.hasNext ()) 
{ 


String name = (String) i.next(); 
System.out.println (name); 


} 


Java5 提 出 了 泛 型 、Iterator 接 口 、 增 强 for 循 环 这 三 种 新 的 方式 。 在 
增强 for 循 环 中 ， 和 迭代 器 的 创建 和 调用 它 的 hasNext O 和 next O 方法 
都 发 生 在 程序 后 端 ， 不 需要 明确 地 写 在 代码 中 ， 因 此 ， 代 码 显得 更 为 
紧凑 。Java5 的 例子 代码 如 清单 3-64 所 示 。 


代码 清单 3-64 Javab 处 理 方式 
List<String> names = neWLinkedList<String> () ; 
names . add ("Apple"); 
names . add ("Orange") ; 
for (String name : names) 


System.out.println (name); 


Java7 为 了 避免 泛 型 的 隐 长 给 出 了 砖 石 运算 符 < > ， 从 而 避免 了 使 
用 new 运算 符 实 例 化 泛 型 类 时 重复 指定 数据 类 型 。 从 Java7 开 始 ， 第 一 
行 代码 可 以 简化 成 以 下 形式 : 

List < String > names-new LinkedList < > (); 

Java8 提 供 了 新 的 迭代 途径 ， 它 使 用 之 前 介绍 的 lambda 表 达 式 对 集 
合 进行 遍历 。Java8 最 主要 的 新 特性 就 是 lambda 表 达 式 以 及 与 此 相关 的 
特性 ， 如 流 (streams) 、 方 法 引用 (method references) 、 功 能 接口 
(functional interfaces) 。 正 是 因为 这 些 新 特性 ， 我 们 能 够 使 用 被 动 迭 
代 器 而 不 是 传统 的 主动 迭代 器 ， 特 别 是 Tterable 接 口 提 供 了 一 个 被 动 迭 
代 器 的 默认 方法 叫 作 forEach () 。 默 认 方法 是 Java8 的 又 一 个 新 特性 ， 
是 一 个 接口 方法 的 默认 实现 ， 在 这 种 情况 下 ，forEach () 方法 实际 上 
是 用 类 似 于 Java5 这 样 的 主动 迭代 器 方式 来 实现 的 。 

实现 了 Iterable 接 口 的 集合 类 (如 : 所 有 列表 List、 集 合 set) 现在 都 
有 一 个 forEach () 方法 ， 这 个 方法 接收 一 个 功能 接口 参数 ， 实 际 上 传 
递 给 forEach () 方法 的 参数 是 一 个 lambda 表 达 式 。 使 用 Java8 的 功能 ， 
代码 变化 如 下 所 示 ， 该 代码 易 读 性 更 好 ， 且 多 线程 环境 下 逻辑 是 线程 
安全 的 ， 更 容易 进行 并 行 化 。 


代码 清单 3-65 Javad 处 理 方式 
List<String> names = new LinkedList<>(); 
names.add("Apple") ; 
names .add ("Orange") ; 


names. forEach(name-> System.out.println (name) ) ; 


请 注意 上 述 代码 中 的 被 动 迭代 与 前 面 三 段 代 码 中 的 主动 迭代 之 间 
的 差异 。 在 主动 迭代 中 由 循环 结构 控制 迭代 ， 并 且 每 次 通过 循环 从 列 
表 中 获取 一 个 对 象 ， 然 后 打印 出 来 。 上 面 的 代码 中 没有 显示 的 循环 结 
构 ， 我 们 只 是 告诉 forEach () 方法 对 列表 中 的 对 象 实施 打印 ， 和 迭代 控 
制 隐 含 在 forEach () 方法 中 。 

流 是 应 用 在 一 组 元 素 上 的 一 次 执行 的 操作 序列 。 集 合 和 数组 都 可 
以 用 来 产生 流 ， 因 此 称 作 数 据 流 。 流 不 存储 集合 中 的 元 素 ， 相 反 ， 流 
失 通 过 管道 操作 来 自 数 据 源 的 值 序列 的 一 种 机 制 。 流 管道 由 数据 源 、 
若干 个 中 间 操 作 (Intermediate Operations) 、 一 个 最 终 操 作 (Terminal 
Operation) 组 成 ， 中 间 操 作对 数据 集 完 成 过 滤 、 检 索 等 中 间 业 务 ， 而 
最 终 操 作 完 成 对 数据 集 处 理 的 最 终 处 理 ， 或 调用 forEach () 方法 。 

当 你 处 理 集合 时 ， 通 常会 迭代 所 有 元 素 并 对 其 中 的 每 一 个 进行 处 
理 。 例 如 ， 假 设 我 们 希望 统计 一 个 文件 中 的 所 有 长 单词 (超过 12 个 字 
母 以 上 的 单词 我 们 认为 是 长 单词 ) 。 代 码 如 清单 3-66 所 示 。 


代码 清单 3-66 Java? 统计 长 单词 出 现 次 数 

import java.io.IOException; 

import java.nio.charset.StandardCharsets; 
import java.nio.file.*; 

import java.nio.file.Paths; 


import java.util.Arrays; 


import java.util.List; 


public class Java7CollectionTest { 
public static void main(String[] args) { 
try { 

String contents = new String(Files.readAllBytes( 
Paths.get ("D:\\Project\\Java8Project\\src\\pom.xml")), 
StandardCharsets.UTF 8); 

List<String> words = Arrays.asList(contents.split("\n")); 

| /进行 迭代 

int count = 0; 

for(String w: words) { 

if(w.length() > 12) count-4; 
} 
System.out.println (count); 
} catch (IOException e) { 


e.printStackTrace(); 


} 


这 里 面 有 什么 错误 吗 ? 其 实 没 有 一 只 是 它 很 难 被 并 行 计 算 。 这 也 
是 Java8 引 入 大 量 操作 符 的 原因 。 在 Java8 中 ， 实 现 相 同 功能 的 操作 符 如 
代码 清单 3-67 所 示 。 


代码 清单 3-67 Javad 统计 长 单词 出 现 次 数 

import java.io.IOException; 

import java.nio.charset.StandardCharsets; 
import java.nio.file.Files; 

import java.nio.file.Paths; 


import java.util.Arrays; 


import java.util.List; 


public class Java8CollectionTest { 
public static void main(String[] args) { 


try { 


String contents = new String(Files.readAllBytes( 


Paths.get ("/home/fuhd/work/workspace/javaee/wwos.platform/pom.xml")), 
StandardCharsets.UTF 8); 
List<String> words = Arrays.asList (contents.split("\n")); 
/1/ 注 意 这 一 名 
long count = words.stream().filter(w -> w.length() > 12) .count () 
System.out.println (count); 
) catch (IOException e) { 


e.printStackTrace(); 


} 


Stream 方 法 会 为 单词 列表 生成 一 个 Stream。 Filter 方 法 会 返回 另 一 个 
只 包含 单词 长 度 大 于 12 的 Stream，Count 方 法 会 将 Stream 化 简 为 一 个 结 
Ro 

一 个 Stream 表 面 上 看 与 一 个 集合 很 类 似 ， 人 允许 你 改变 和 获取 数据 。 
但 是 实际 上 它 与 集合 是 有 很 大 区 别 的 : 


(1) Stream 自 己 不 会 存储 元 素 。 元 素 可 能 被 存储 在 底层 的 集合 
中 ， 或 者 根据 需要 产生 出 来 ; 

(2) Stream 操 作 符 不 会 改变 源 对 象 。 相 反 ， 它 们 会 返回 一 个 持 有 
结果 的 新 Stream ; 

(3) _ Stream 操作 符 可 能 是 延迟 执行 的 。 这 意味 着 它们 会 等 到 需 
结果 的 时 候 才 执行 。 

许多 人 发 现 Stream 表 达 式 比 循环 的 可 读 性 更 好 。 此 外 ， 它 们 还 很 容 
易 进 行 并 行 执 行 。 代 码 清单 3-68 包 含 的 是 一 段 如 何 并 行 统 计 长 单词 的 代 
但 。 


代码 清单 3-68 Java 并 行 统计 单词 
import java.io.IOException; 
import java.nio.charset.StandardCharsets; 
import java.nio.file.Files; 


import java.nio.file.Paths; 


import java.util.Arrays; 


import java.util.List; 


public class T8 { 
public static void main(String[] args) ( 
try ( 
String contents - new String(Files.readAllBytes( 


Paths.get ("/home/fuhd/work/workspace/javaee/wwos .platform/pom.xml")), 
StandardCharsets.UTF 8); 
List<String> words = Arrays.asList(contents.split("\n")); 
// 注 意 这 一 句 ，stream() 改 成 7 了 parallelStream () 方 法 
long count = words.parallelStream().filter(w -> w.length() > 12).count(); 
System.out.println(count); 


} catch (IOException e) { 


e.printStackTrace(); 


} 


只 要 将 stream () 方法 改 成 parallelStream 方 法 ， 就 可 以 让 Stream 
API 并 行 执行 过 滤 和 统计 操作 。 

Stream 遵 循 “做 什么 ， 而 不 是 怎么 去 做 ”的 原则 。 在 我 们 的 示例 中 ， 
首 述 了 需要 做 什么 : 获得 长 单词 并 对 它们 的 个 数 进行 统计 。 我 们 没有 
指定 按照 什么 顺序 ， 或 者 在 哪个 线程 中 做 ， 它 们 都 是 理 所 应 当 发 生 
的 。 相 反 ， 循 环 在 一 开始 就 需要 指定 如 何 进行 计算 ， 因 此 就 失去 了 优 
化 的 机 会 。 

当 你 使 用 Stream 时 ， 你 会 通过 三 个 阶段 来 建立 一 个 操作 流水 线 : 

(1) 创建 一 个 Stream ; 

(2) 在 一 个 或 多 个 步骤 中 ， 指 定 将 初始 Stream 转 换 为 另 一 个 
Stream 的 中 间 操 作 ，; 

(3) 使 用 一 个 终止 操作 来 产生 一 个 结果 。 该 操作 会 强制 它 之 前 的 
延迟 操作 立即 执行 。 在 这 之 后 ， 该 Stream 就 不 会 再 被 使 用 。 

在 我 们 的 示例 中 ， 通 过 Stream 或 者 parallelStream 方法 来 创建 
Stream， 再 通过 filter 方 法 对 其 进行 转换 ， 而 count 就 是 终止 操作 。 

ER: Stream 操 作 不 会 按照 元 素 的 调用 顺序 执行 。 在 我 们 的 例子 

， 只 有 在 count 被 调用 的 时 候 才 会 执行 Stream 操 作 。 当 count 方 法 需要 

第 一 个 元 素 时 ，filter 方 法 会 开始 请 求 各 个 元 素 ， 直 到 找到 一 个 长 度 大 
于 12 的 元 素 。 

以 下 代码 使 用 流 管道 计算 以 字母 A 开头 的 人 名 的 个 数 ， 是 Java8 代 
码 。 列 表 names 用 于 创建 流 ， 然 后 使 用 过 滤器 对 数据 集 进行 过 滤 ，filter 
() 方法 只 过 滤 出 以 字母 A 开头 的 名 字 ， 该 方法 的 参数 是 一 个 lambda 表 
达 式 。 最 后 ， 流 的 count () 方法 作为 最 终 操 作 ， 得 到 应 用 结果 。 中 间 
操作 除了 filter () 之 外 ， 还 有 distinct () ~ sorted () 、map () 等 ， 
一 般 是 对 数据 集 的 整理 ， 返 回 值 一 般 也 是 数据 集 。 清 单 3-69 代 码 使 用 的 
是 主动 式 迭 代 方 式 ， 在 多 线程 环境 下 该 逻辑 是 线程 不 完全 的 。 


代码 清单 3-69 主动 式 迭 代 方 法 
List<String> names = new LinkedList<>(); 
names.add("Annie") ; 
names.add ("Alice"); 
names . add ("Bob"); 
long count = names.stream() 


.filter(name -> name.startsWith("A").count(); 


同样 的 代码 在 Java7 里 如 清单 3-70 所 示 。 


代码 清单 3-70 Java? 主动 式 迭 代 方 法 
List<String> names = new LinkedList<>(); 
names .add ("Annie"); 
names .add ("Alice"); 
names . add ("Bob") ; 


long count = 0; 


for (String name : names) { 
if (name.startsWith("A")) 
++count; 


} 


最 终 方法 往往 是 完成 对 数据 集中 数据 的 处 理 ， 如 forEach () , 还 
有 allMatch () 、anyMatch () 、findAny () 、findFirst () ， 数 值 计 
算 类 的 方法 有 sum () 、max () 、min () 、averag () 等 ， 最 终 方法 
也 可 以 是 对 集合 的 处 理 ， 如 reduce () . collect () 等 。reduce () A 
法 的 处 理 方式 一 般 是 每 次 都 产生 新 的 数据 集 ， 而 collect () 方法 是 在 原 
数据 集 的 基础 上 进行 更 新 ， 过 程 中 不 产生 新 的 数据 集 。 

无 论 是 从 易 读 写 的 角度 来 说 ， 还 是 从 API 设 计 的 角度 来 说 迭代 器 、 
Iterable 接 口 和 foreach 循环 都 是 非常 好 用 的 。 但 代价 是 ， 使 用 它们 时 是 
会 额外 在 堆 上 为 每 个 循环 子 创建 一 个 对 象 。 如 果 循 环 要 执行 很 多 很 多 


遍 ， 请 注意 避免 生成 无 意义 的 实例 ， 最 好 用 基本 的 指针 循环 方式 来 代 
奉 上 述 迭 代 器 、Iterable 接 口 和 foreach 循 环 。 

Java8 集 合 类 不 仅 具 有 Stream () 方法 ， 该 方法 返回 一 个 连续 的 数 
据 流 ，Java8 集 合 类 还 有 一 个 parallelStream () 方法 ， 该 方法 返回 一 个 
并 行 流 。 并 行 流 的 作用 在 于 允许 管道 操作 同时 在 不 同 的 Java 线 程 中 执行 
以 提高 性 能 。 但 要 注意 的 是 ， 集 合 元 素 的 处 理 顺 序 可 能 发 生 改 变 。 

Java8 支 持 一 种 新 功能 进行 迭代 ， 它 是 声明 性 的 方法 ， 这 种 新 方法 
带 来 的 好 处 是 代码 的 可 读 性 更 好 ， 不 易 出 错 ， 对 于 多 线程 支持 更 好 、 
更 丰富 ， 程 序 更 容易 并 行 化 。 然 而 测试 表明 ， 并 行 流 对 每 一 种 集合 类 
而 言 不 一 定性 能 更 快 。 


3.2.10 优先 考虑 并 行 计 算 


当 在 多 核 处 理 器 上 部 署 Java 程 序 时 ， 由 于 Java7 引 入 的 ForkJoinPool 
和 Java 8 引入 的 并 行 数 据 流 [8] 都 对 并 行 处 理 有 所 帮助 ， 所 以 在 多 核 环境 
下 表现 尤为 明显 ， 这 是 因为 所 有 的 处 理 器 都 可 以 做 到 访问 相同 的 内 
存 。 这 两 个 技术 我 们 会 在 第 5 章 具体 深入 介绍 ， 本 小 节 只 给 出 一 些 基 本 


介绍 。 


数据 流 的 特点 包括 如 下 几 点 。 

m 元 素 序 列 : 流 提 供 了 一 组 特定 类 型 的 以 顺序 方式 元 素 。 流 获取 / 
计算 需求 的 元 素 。 它 不 存储 元 素 。 

m5: 流 使 用 集合 ， 数 组 或 1/O 资 源 为 输入 源 。 

mg 聚合 操作 : 数据 流 支 持 如 filter、map、limit、reduced、find、 
match 等 聚合 操作 。 

m 管道 传输 : 大 多 数 流 操作 的 返回 流 本 身 使 他 们 的 结果 可 以 被 管道 
传输 。 这 些 操作 被 称 为 中 间 操 作 以 及 它们 的 功能 是 利用 输入 ， 处 理 输 
入 和 输出 返回 到 目标 。collect () 方法 是 终端 操作 ， 这 是 通常 出 现在 管 
道 传输 操作 结束 标记 流 的 结束 。 

m 自动 迭代 : 流 操作 内 部 做 了 反复 对 比 ， 其 中 明确 迭代 需要 集合 提 
供 源 元 素 。 

现在 ， 类 似 Scala 这 样 的 函数 式 编程 语言 都 鼓励 使 用 递归 。 因 为 递 
归 通 常 意 味 着 能 分 解 到 单独 个 体 优 化 的 尾 递归 (tail-recursing) o WR 


你 使 用 的 编程 语言 能 够 支持 那 是 再 好 不 过 的 了 ， 不 过 即使 如 此 ， 也 要 
注意 对 算法 的 细微 调整 会 让 尾 递 归 变 为 普通 递归 。 所 以 我 们 希望 编译 
器 能 自动 探测 到 这 一 点 ， 否 则 本 来 我 们 将 为 只 需 使 用 几 个 本 地 变量 就 
能 搞定 的 事情 而 白白 浪费 大 量 的 堆栈 框架 (stack frames) o 

JDK7 新 增 了 并 发 框架 -fork/join 框 架 ， 在 这 种 框架 下 ，ForkJoinTask 
代表 一 个 需要 执行 的 任务 ， 真 正 执行 这 些 任务 的 线程 是 放 在 一 个 线程 
池 (ForkJoinPool) 里 面 。ForkJoinPool 是 一 个 可 以 执行 ForkJoinTask 的 
ExcuteService， 与 ExcuteService 不 同 的 是 它 采 用 了 work-stealing 模 式 ， 
即 所 有 在 池 中 的 线程 尝试 去 执行 其 他 线程 创建 的 子 任务 ， 这 样 就 很 少 
有 线程 处 于 空 闪 状态 ， 非 常 高 效 。 

总 的 来 说 ，Java 8 引入 批量 操作 接口 的 目的 是 为 了 给 Java 集 合 类 库 
增加 批量 操作 数据 的 支持 。 通 常 称 这 种 批量 数据 操作 为 “Java 中 的 
filter/map/reduce”。 批 量 数 据 操作 有 串 行 (在 当前 线程 上 ) 和 并 行 (使 
用 多 线程 ) 两 种 操作 模式 。Java 8 并 行 流 (parallel stream) 采用 共享 线 
程 池 ， 对 性 能 造成 了 严重 影响 。 可 以 包装 流 来 调用 自己 的 线程 池 解 决 
性 能 问题 。 所 以 ， 这 种 并 行 处 理 较 之 在 跨 网 络 的 不 同 机 器 上 进行 扩 
展 ， 根 本 的 好 处 是 几乎 可 以 完全 消除 延迟 。 

虽然 并 行 计算 的 效果 很 明显 ， 但 是 我 们 需要 注意 以 下 两 点 。 

(1) 并 行 处 理会 吃 光 处 理 器 资源 。 并 行 处 理 为 批 处 理 带 来 了 极 大 
的 好 处 ， 但 同时 也 是 非 同 步 服 务 器 (如 HTTP) 的 豆 梦 。 为 什么 在 过 去 
的 几 十 年 中 我 们 一 直 在 使 用 单线 程 的 Servlet 模 型 ， 这 是 因为 并 行 处 理 仅 
在 纵向 扩展 时 才能 带 来 实际 的 好 处 。 

(2) 并 行 处 理 对 算法 复杂 度 没 有 影响 。 如 果 你 的 算法 的 时 间 复 杂 
HAO (nlogn) ， 让 算法 X 个 处 理 器 上 运行 ， 事 件 复杂 度 仍然 为 O 
(nlogn/x) ， 因 为 X 只 是 算法 中 的 一 个 无 关 紧 要 的 常量 。 你 节省 的 仅仅 
是 时 钟 时 间 (wall-clock time) ， 实 际 的 算法 复杂 度 并 没有 降低 。 

降低 算法 复杂 度 窟 无 疑问 是 改善 性 能 最 行 之 有 效 的 办 法 。 比 如 对 
于 一 个 HashMap 实 例 的 lookup () 方法 来 说 ， 事 件 复杂 度 O (1) 或 者 
空间 复杂 度 O (1) 是 最 快 的 。 如 果 你 不 能 降低 算法 的 复杂 度 ， 也 可 以 
通过 找到 算法 中 的 关键 点 并 加 以 改善 的 方法 ， 来 起 到 改善 性 能 的 作 
用 。 


3.3 字符 串 概 念 


3.3.1 String 对 象 


String 对 象 是 我 们 日 常 使 用 的 对 象 类 型 ， 字 符 串 对 象 或 者 其 等 价 对 
Z 〈 如 char 数 组 ) ， 在 内 存 中 总 是 占据 了 最 大 的 空间 块 ， 因 此 如 何 高 效 
地 处 理 字 符 串 ， 是 提高 系统 整体 性 能 的 关键 。 

一 个 Java 对 象 实际 还 会 占用 些 额外 的 空间 ， 如 : 对 象 的 class 信 息 、 
ID、 在 虚拟 机 中 的 状态 。 在 Oracle JDK 的 Hotspot 虚 拟 机 中 ， 一 个 普通 
的 对 象 需要 额外 8 个 字 节 。 

如 果 对 于 String (JDK6) 的 成 员 变 量 声明 如 代码 清单 3-71 所 示 。 


代码 清单 3-71 String 成 员 变量 声明 
private final char value[]; 
private final int offset; 
private final int count; 


private int hash; 


那么 应 该 如 何 计算 该 String 所 占 的 空间 ? 

首先 计算 一 个 空 的 char 数 组 所 占 空 间 ， 在 Java 里 数组 也 是 对 象 ， 
而 数组 也 有 对 象 头 ， 所 以 一 个 数组 所 占 的 空间 为 对 象 头 所 占 的 空间 加 
上 数组 长 度 ， 即 8+4=12 个 字 节 ， 经 过 填充 后 为 16 个 字 节 。 那 么 一 个 空 
String 所 占 空 间 为 : 对 象 头 (8 字 节 ) +char 数 组 (16 字 节 ) +3 个 int 

(3x4=12 字 节 ) +1 个 char 数组 的 引用 (4 字 节 ) =40 字 节 。 因 此 一 个 实 
际 的 String 所 占 空间 的 计算 公式 就 是 ，8* ( (8+2*n+4+12) +7) /8=8* 
(int) ( ( ( (n) *2) +43) /8) 其 中 ，n 为 字符 串 长 度 。 

String 对 象 可 以 认为 是 char 数 组 的 延伸 和 进一步 封装 ， 它 主要 由 3 部 
分 组 成 : char 数 组 、 偏 移 量 和 String 的 长 度 。char 数 组 表示 String 的 内 
容 ， 它 是 String 对 象 所 表示 字符 串 的 超 集 。String 的 真实 内 容 还 需要 由 
偏 移 量 和 长 度 在 这 个 char 数 组 中 进行 定位 和 截取 。 

String 对 象 的 创建 方式 很 有 讲究 ， 关 键 是 要 明白 它 内 部 的 实现 原 
理 。 以 下 列举 了 4 点 原理 。 


(1) 当 使 用 任何 方式 来 创建 一 个 字符 串 对 象 X 时 ，Java 运 行 时 
(运行 中 JVM) 会 拿 着 这 个 X 在 String 池 中 查找 是 否 存 在 内 容 相 同 的 字 

符 串 对 象 ， 如 果 不 存 在 ， 则 在 闻 中 创建 一 个 字符 串 X， 否 则 ， 不 会 创建 
对 象 ， 即 不 会 在 池 中 添加 ; 

(2) 前 面 说 过 ，Java 内 部 只 要 使 用 new 关 键 字 来 创建 对 象 ， 则 一 
ER 〈 在 堆 区 或 栈 区 ) 创建 一 个 新 的 对 象 ; 

(3) 使 用 直接 指定 或 者 使 用 纯 字符 串 串 联 来 创建 String 对 象 ， 则 
仅仅 会 检查 维护 String 闻 中 的 字符 串 ， 池 中 没有 就 创建 一 个 ， 如 果 存 
在 ， 就 不 需要 创建 新 的 ， 但 绝 不 会 在 堆栈 区 再 去 创建 该 String 对 象 ; 

(4) 使 用 包含 变量 的 表达 式 来 创建 String 对 象 ， 则 不 仅 会 检查 并 
维护 String 池 ， 而 且 还 会 在 堆栈 区 创建 一 个 String 对 象 。 

在 拼接 静态 字符 串 时 ， 尽 量 用 +， 因 为 通常 编译 器 会 对 此 做 优化 ， 
如 String test- " this “+ is ^ a" + test " ^ string", miaa 
它 视 为 String test- " this is a test string”。 所 以 在 拼接 动态 字符 串 时 ， 尽 
量 用 StringBuffer 或 StringBuilder 的 append， 这 样 可 以 减少 构造 过 多 的 临 
时 String 对 象 。 

String 有 3 个 基本 特点 ， 即 不 变性 、 针 对 常量 池 的 优化 及 类 的 final 定 
Xo 

变性 指 的 是 String 对 象 一 旦 生成 ， 则 不 能 再 对 它 进行 改变 。 
String 的 这 个 特性 可 以 泛 化 成 不 变 (immutable) 模式 ， 即 一 个 对 象 的 状 
态 在 对 象 被 创建 之 后 就 不 再 发 生变 化 。 不 变 模式 的 主要 作用 在 于 当 一 
个 对 象 需要 被 多 线程 共享 ， 并 且 访 问 频 繁 时 ， 可 以 省 略 同步 和 锁 等 待 
的 时 间 ， 从 而 大 幅 提高 系统 性 能 。 

针对 常量 闻 的 优化 指 的 是 当 两 个 String 对 象 拥 有 相同 的 值 时 ， 它 们 
只 引用 常量 闻 中 的 同一 个 拷贝 ， 当 同一 个 字符 串 反 复出 现时 ， 这 个 技 
术 可 以 大 幅度 节省 内 存 空间 。 

下 面 代码 str1、str2、str4 引 用 了 相同 的 地 址 ， 但 是 str3 却 重新 开辟 
了 一 块 内 存 空 间 ， 虽 然 str3 单 独占 用 了 堆 空 间 ， 但 是 它 所 指向 的 实体 和 
str1 完 全 一 样 。 代 码 清 单 3-72 代 码 演 示 了 4 个 String 对 象 的 引用 方式 对 
比 。 


代码 清单 3-72 String 对 象 引用 方式 对 比 实验 
public class StringDemo { 
public static void main(String[] args) { 
String strl = "abc"; 


String str2 - "abc"; 


String str3 = new String("abc"); 
String str4 = strl; 
System.out.println("is strl = str2?"+(strl==str2));//M42<@ strl 和 str2 
对 象 引用 了 相同 内 存 地 址 
System.out.println("is strl = str3?"+(strl==str3)); // 检 查 是 否 strl 和 str3 
对 象 引 用 了 相同 内 存 地 址 
System.out.println("is strl refer to str3?"+(strl.intern()==str3.intern()));//M4 
RE stri 的 内 容 和 str3 相同 
System.out.println("is strl = str4"4 (strl--str4)); // 检 查 是 否 strl 和 str4 对 
象 引用 了 相同 内 存 地 址 
System.out.println("is str2 = str4"+(str2==str4)); // 检 查 是 否 str2 和 str4 
对 象 引用 了 相同 内 存 地 址 
System.out.println("is str4 refer to str3?"4(str4.intern()--str3.intern())) ;//t 
$16 str3 的 内 容 和 str4 相同 
} 


代码 3-72 运 行 输出 如 清单 3-73 所 示 。 


代码 清单 3-73 String 对 象 引用 方式 对 比 实验 运行 输出 
is strl = str2?true 
is strl = str3?false 
is strl refer to str3?true 
is strl = str4true 


is str2 = str4true 


is str4 refer to str3?true 


程序 代码 3-72 里 面 使 用 了 String 对 象 的 intern () 方法 ，intern () 
方法 是 一 个 本 地 方法 ， 定 义 为 public native String intern () ; intem () 
方法 的 价值 在 于 让 开发 者 能 将 注意 力 集中 到 String 闻 上 。 当 调用 intern 方 
法 时 ， 如 果 池 已 经 包含 一 个 等 于 此 String 对 象 的 字符 串 (该 对 象 由 
equals (Object) 方法 确定 ) ， 则 返回 池 中 的 字符 串 。 否 则 ， 将 此 String 
对 象 添加 到 闻 中 ， 并 且 返 回 此 String 对 象 的 引用 。 

当 我 们 下 意识 地 使 用 newString 去 构造 一 个 全 新 的 字符 串 而 不 是 用 
赋值 符 来 创建 (BA) 一 个 字符 串 时 ， 就 导致 了 另 一 个 潜在 的 性 能 问 
题 ， 即 : 重复 创建 大 量 相 同 的 字符 串 。 说 到 这 里 ， 您 也 许 会 想到 使 用 
缓存 闻 的 技术 来 解决 这 一 问题 ， 大 概 有 如 下 两 种 方法 。 

(1) 使 用 String 的 intern () 方法 返回 JVM 对 字符 串 缓 存 池 里 相应 
已 存在 的 字符 串 引 用 ， 从 而 解决 内 存 性 能 问题 。 不 建议 采用 这 种 方案 
的 原因 在 于 ， 首 先 ，intern () 所 使 用 的 池 会 是 JVM 中 一 个 全 局 的 池 ， 
很 多 情况 下 我 们 的 程序 并 不 需要 如 此 大 作用 域 的 缓存 ; 其 次 ，intern 

( 所 使 用 的 是 JVM heap 中 PermGen 相 应 的 区 域 ， 在 JVM 中 PermGen 是 
用 来 存放 装载 类 和 创建 类 实例 时 用 到 的 元 数据 。 程 序 运 行 时 所 使 用 的 
内 存 绝 大 部 分 存放 在 JVM heap 的 其 他 区 域 ， 此 外 ， 过 多 得 使 用 intern 

() 将 导致 PermGen 过 度 增长 而 最 后 返回 OutOfMemoryError, E4733 
圾 收集 器 不 会 对 被 缓存 的 String 做 垃圾 回收 。 所 以 我 们 建议 使 用 第 二 种 
方式 。 

(2) 用 户 自 己 构建 缓存 ， 这 种 方式 的 优点 是 更 加 灵活 。 创 建 
HashMap, ， 将 需 缓存 的 String 作为 key 和 value 存 放 入 HashMap。 假 设 我 
们 准备 创建 的 字符 串 为 key， 将 Map cacheMap 作 为 缓冲 池 ， 那 么 返回 
key 的 代码 如 清单 3-74 所 示 。 


代码 清单 3-74 Map cacheMap 缓存 池 
private String getCacheWord(String key) | 
String tmp = cacheMap.get (key) ; 
if(tmp != null) { 
return tmp; 
) eise ( 
cacheMap.put(key, key); 


return key; 


3.3.2 善 用 String 对 象 的 SubString 方 法 


JDK6 中 String.substring (int，int) 的 源码 为 如 清单 3-75 所 示 。 


代码 清单 3.75 subString 源 代码 
public String substring(int beginIndex, int endIndex) { 
if (beginIndex < 0) { 
throw new StringIndexOutOfBoundsException (beginIndex); 
} 
if (endIndex > count) | 
throw new StringIndexOutOfBoundsException (endIndex); 
} 
if (beginIndex > endIndex) { 
throw new StringIndexOutOfBoundsException(endIndex - beginIndex) ; 
} 
return ((beginIndex == 0) && (endIndex == count)) ? this : 


new String(offset * beginIndex, endIndex - beginIndex, value); 
POE M M MN 
从 上 面 的 源 代 码 可 以 看 到 ，SubString 源 代码 里 面 有 这 么 一 行 : 


“new String (offsettbeginIndex, endIndex-beginIndex，value) ; ”该 行 


代码 的 目的 是 为 了 能 高 效 且 快速 地 共享 String 内 的 char 数 组 对 象 。 
调用 的 String 构 造 遂 数 源 人 码 为 如 清单 3-76 所 示 。 


代码 清单 3-76 调用 String 构造 函数 源 代码 
String(int offset, int count, char value[]) ( 
this.value = value; 
this.offset - offset; 
this.count = count; 


} 


在 这 种 通过 偏 移 量 来 截取 字符 串 的 方法 中 ，String 的 原生 内 容 value 
数组 被 复制 到 新 的 子 字符 串 中 。 因 此 String.substring () 所 返回 的 String 
仍然 会 保存 原始 String， 设 想 ， 如 果 原 始 字 符 串 很 大 ， 截 取 的 字符 长 度 
却 很 得 ， 那 么 截取 的 子 字符 串 中 包含 了 原生 字符 串 的 所 有 内 容 ， 并 占 
据 了 相应 的 内 存 空 间 ， 而 仅仅 通过 偏 移 量 和 长 度 来 决定 自己 的 实际 取 
值 。 这 就 是 为 什么 几 万 个 平均 长 度 的 单词 竟然 占用 了 上 百 兆 的 内 存 的 
原因 ， 显 然 这 种 算法 提高 了 速度 却 浪费 了 空间 ， 对 于 通过 String.split 

( 或 String.substring () 截取 出 大 量 String 的 操作 ， 这 种 设计 在 很 多 时 
候 可 以 很 大 程度 的 节省 内 存 ， 因 为 这 些 String 都 复 用 了 原始 String， 只 
是 通过 int 类 型 的 start，end 等 值 来 标识 每 一 个 String。 而 对 于 从 一 个 巨大 
的 String 截 取 少 数 String 为 以 后 所 用 ， 这 样 的 设计 则 造成 大 量 元 余数 
据 。 

导致 大 量 内 存 占 用 的 根源 是 String.substring () 返回 结果 中 包含 大 
量 原始 String， 那 么 减少 内 存 浪费 的 途径 就 是 去 除 这 些 原始 String。 我 
们 这 里 采取 再 次 调用 newString 构 造 一 个 仅 包 含 截取 出 的 字符 串 的 
String， 我 们 可 调用 String.toCharArray () 方法 ，String newString=new 
String (smallString.toCharArray () ) ; 举 一 个 极端 例子 ， 假 设 要 从 一 
个 字符 串 中 获取 所 有 连续 的 非 空 子 串 ， 字 符 串 长 度 为 n， 如 果 用 JDK 本 
身 提供 的 String.substring () 方法 ， 则 总 共 的 连续 非 空子 串 个 数 为 n+ 

(n-1) + (n-2) +...+1=n* (n+1) 2-0 (n2) ， 由 于 每 个 子 串 所 占 的 
空间 为 常数 ， 故 空间 复杂 度 也 为 O (n2). 

如 果 用 本 文 建议 的 方法 ， 即 构造 一 个 内 容 相 同 的 新 的 字符 串 ， 则 
所 需 空间 正比 于 子 串 的 长 度 ， 则 所 需 空间 复杂 度 为 1*+n+2* (n-1) +3* 


(n-2) +...4n*1= (n3+3*n2+2*n) /6=O (n3) 。 所 以 ， 从 以 上 定量 的 
分 析 看 来 ， 当 需 要 截取 的 字符 串 长 度 总 和 大 于 等 于 原始 文本 长 度 ， 我 
们 这 里 建议 的 方法 带 来 的 空间 复杂 度 反 而 高 了 ， 而 现 有 的 
String.substring () 设计 恰好 可 以 共享 原始 文本 从 而 达到 节省 内 存 的 目 
的 。 反 之 ， 当 所 需要 截取 的 字符 串 长 度 总 和 远 小 于 原始 文本 长 度 时 ， 
用 我 们 推荐 的 方法 会 在 很 大 程度 上 节省 内 存 ， 在 大 文本 数据 处 理 中 其 
优势 显而易见 。 

代码 清单 3-77 所 示 代 码 演示 了 使 用 substring 方 法 在 一 个 很 大 的 string 
独 享 里 面 截取 一 段 很 小 的 字符 串 ， 如 果 采 用 string 的 substring 方 法 会 造 
成 内 存 溢出 ， 如 果 采 用 反复 创建 新 的 string 方 法 可 以 确保 正常 运行 。 


代码 清单 3-77 String 的 subString 示例 


import java.util.ArrayList; 
import java.util.List; 


public class StringDemo { 
public static void main(String[] args) { 

List<String> handler = new ArrayList<String>(); 

for(int i1=0;1<1000;i++) { 
HugeStr h = new HugeStr(); 
ImprovedHugeStr hl = new ImprovedHugeStr () ; 
handler.add(h.getSubString(1, 5));//MARS 
handler.add(hl.getSubString(1, 5));//A#ARA 


} 
// 定 义 一 个 静态 类 HugeStr 
static class HugeStr{ 
private String str = new String(new char[800000]); 
public String getSubString(int begin, int end) { 


return str.,substring (begin，end) ;// 调 用 String # subString 方法 


} 
// 定 义 一 个 静态 类 InprovediugeStr 
static class ImprovedHugeStr| 
private String str = new String(new char[10000000]); 
public String getSubString(int begin,int end) { 
return new String (str.substring (begin，end) ) ;// 重 新 创建 一 个 String HR 


| 
上 面 的 代码 3-77 运 行 后 输出 如 3-78 所 示 。 


代码 清单 3-78 String BY subString 示例 运行 输出 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 
at java.util.Arrays.copyOf (Unknown Source) 
at java.lang.StringValue.from(Unknown Source) 
at java.lang.String.«init? (Unknown Source) 
at StringDemo$ImprovedHugeStr.«init» (StringDemo.java:23) 


at StringDemo.main(StringDemo.java:9) 


上 面 的 例子 里 面 ，ImprovedHugeStr 可 以 工作 是 因为 它 使 用 没有 内 
存 泄漏 的 String 构 造 冰 数 重新 生成 了 String 对 象 ， 使 得 由 subString () A 
法 返回 的 ， 存 在 内 存 泄漏 问题 的 String 对 象 失 去 所 有 的 强 引 用 ， 从 而 被 
垃圾 回收 器 识别 为 垃圾 对 象 进行 回收 ， 保 证 了 系统 内 存 的 稳定 。 

此 外 ， 很 多 文章 建议 读者 来 用 StringBuffer 替 换 String 对 象 ， 但 是 有 
一 种 情况 例外 ， 即 如 果 读 者 确定 目 己 定义 的 字符 串 是 常量 字符 串 ， 那 
么 建议 不 要 使 用 StringBuffer 类 型 定义 这 个 常量 字符 串 ， 还 是 采用 String 
方式 ， 因 为 常量 字符 串 并 不 需要 动态 改变 长 度 。 我 们 使 用 String 对 象 的 
indexof ( ) 和 substring () 来 分 析 字 符 串 容易 导致 
stringindexoutofboundsexception 错 误 ， 而 使 用 stringtokenizer 类 来 分 析 字 


符 串 则 会 容易 一 些 ， 效 率 也 会 高 一 些 ， 也 不 会 出 现 
stringindexoutofboundsexception 错 误 。 


3.3.3 用 charat () 代替 startswith () 


如 果 只 是 查找 单个 字符 的 话 ， 可 以 考虑 用 charat O 代替 startswith 
() ， 虽 然 用 一 个 字符 作为 参数 调用 startswith () 从 代码 角度 来 看 也 
不 会 抛 错 ， 但 从 性 能 角度 上 来 看 ， 这 里 还 是 采用 charat () 方式 比较 
快 。 


代码 清单 3-79 startswith() 方 法 示例 
private void method(string s) ( 
if (s.startswith("a")) | 
gave 
} 
} 


我 们 可 以 将 'startswith () “' 替 换 成 'charat () '， 如 代码 清单 3-80 所 
Ro 


代码 清单 3-80 ”charat() 方 法 示例 
private void method(string s) ( 
if ('a' == s.charat(0)) ( 
[dase 
} 
} 


3.3.4 在 字符 串 相 加 的 时 候 ， 使 用 "代替 " 


如 果 该 字符 串 只 有 一 个 字符 的 话 ， 我 们 建议 使 用 单 引 号 ， 而 不 是 
双 引 号 。 原 始 代码 如 清单 3-81 所 示 。 


代码 清单 3-81 字符 串 相 加 实验 
public class strClass { 
public void method(string s) { 
string string = s + "d" // violation. 


string = "abc" + "d" // violation. 


} 


我 们 把 上 面 程序 的 一 个 字符 的 字符 串 蔡 换 成 单 引 号 ， 如 代码 清单 3- 
82 所 示 。 


代码 清单 3-82 ”字符 串 相 加 实验 strClass 
public class strClass { 
public void method(string s) ( 
string string = s + 'd' 


string = "abc" + 'd' 


3.3.5 字符 串 切 割 


String API 支 持 传 入 正则 表达 式 帮 助 处 理 字 符 串 ， 但 是 使 用 Split 方 
式 用 作 简 单 的 字符 串 分 割 时 性 能 较 差 。 我 们 对 比 String 对 象 的 split 方 法 
和 StringTokenizer 类 的 处 理 字 符 串 性 能 ， 代 码 如 清单 3-83 所 示 。 


代码 清单 3-83 ”处理 字符 串 性 能 实验 


import java.util.StringTokenizer; 


public class splitandstringtokenizer{ 
public static void main(String[] args) { 
String orgStr = null; 
StringBuffer sb = new StringBuffer(); 
for(int i1=0;1<100000;1i++) { 
sb. append (i); 
sb.append(","); 


} 

orgStr = sb.toString(); 

long start = System.currentTimeMillis(); 

for(int i=0;1<100000;1i++) { 
orgStr.split(",");//iÀJl split 方法 切割 字符 串 

} 

long end = System.currentTimeMillis(); 


System.out.println(end-start); 


start - System.currentTimeMillis(); 
String orgStrl = sb.toString(); 
StringTokenizer st = new StringTokenizer (orgStrl,","); 
for(int i=0;1<100000;i++) { 
st.nextToken (); 
} 
st = new StringTokenizer(orgStrl,","); //StringTokenizer 类 切割 字符 串 
end = System.currentTimeMillis(); 


System.out.println(end-start); 


Start = System.currentTimeMillis(); 
String orgStr2 = sb.toString(); 
String temp - orgStr2; 
while (true) { 
String splitStr = null; 
int jetemp.indexOf(","); 
if(j«0)break; 
splitStr-temp.substring(0, j); 
temp = temp.substring(j+1);//AM String HRM subString 方法 切割 字符 串 
) 
temp-orgStr2; 
end = System.currentTimeMillis(); 


System.out.println(end-start); 


代码 清单 3-84 ”处 理 字符 串 性 能 实验 运行 输出 ， 单 位 毫秒 
39015 
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上 面 的 实验 里 面 ， 当 一 个 StringTokenizer 对 象 生成 后 ， 通 过 它 的 
nextToken () 方法 便 可 以 得 到 下 一 个 分 割 的 字符 串 ， 通 过 
hasMoreToken 方 法 可 以 知道 是 否 有 更 多 的 字符 串 需要 处 理 。 对 比 发 现 
split 的 耗 时 非常 的 长 ， 采 用 StringTokenizer 对 象 处 理 速 度 很 快 。 我 们 尝 
试 自己 实现 字符 串 分 割 算法 ， 使 用 subString 方 法 和 indexof 方 法 组 合 而 
成 的 字符 串 分 割 算 法 可 以 帮助 很 快 切 分 字符 串 并 替换 内 容 。 

我 们 增加 一 个 示例 代码 ， 如 果 需 要 从 一 个 较 大 的 字符 串 里 面 分 割 
出 数据 ， 效 率 差 距 很 大 。 


代码 清单 3-85 “分割 字符 串 性 能 实验 


import java.util.StringTokenizer; 


public class testSplit { 
public static void splitBefore(String startDate) { 
long start = System.currentTimeMillis(); 
StringBuffer stb - new StringBuffer(); 
if(startDate!-null)( 
// 获 取 日 期 yy-mm-dd 
int count = 0; 
for(int i=0;i<1000;i++){ 
stb.append(startDate.split(" ")[i]); 
count++; 
} 
System.out.println (stb); 


} 
System.out.println(System.currentTimeMillis() - start); 


public static void splitAfter(String startDate) { 
long start = System.currentTimeMillis(); 
StringBuffer stb - new StringBuffer(); 
if (startDate!=null) { 
// 获 取 日 期 yy-mm-dd 
int count = 0; 
StringTokenizer st - new StringTokenizer(startDate," "); 
while(st.hasMoreElements() ) { 
Stb.append(st.nextToken()); 
count++; 
} 
System.out.println (stb); 
) 


System.out.println(System.currentTimeMillis() - start); 


public static void main(String[] args) { 
StringBuffer sb - new StringBuffer(); 
for(int i=0;i<1000;i++) { 
Sb.append (i); 
sb.append(" "); 
) 
testSplit.splitBefore (sb.toString()); 
testSplit.splitAfter(sb.toString()); 


上 面 的 运行 输出 ，Split 方 式 相对 来 说 多 花费 了 343 毫 秒 。 可 以 看 
出 ，Split 方 法 确实 比 StringTokenizer 类 要 慢 很 多 。 

StringTokenizer 类 人 允许 一 个 应 用 程序 进入 一 个 令 牌 (token) ， 
StringTokenizer 类 的 对 象 在 内 部 已 经 标识 化 的 字符 串 中 维持 了 当前 位 
置 。 一 些 操作 使 得 在 现 有 位 置 上 的 字符 串 提前 得 到 处 理 ， 一 个 令 牌 的 
值 是 由 获得 其 曾经 创建 StringTokenizer 类 对 象 的 字 串 所 返回 的 。 

除了 上 面 介 绍 的 ， 使 用 stringtokenizer 类 来 分 析 字 符 串 也 会 容易 一 
些 ， 效 率 也 相对 于 indexof () 和 substring () 这 两 个 方法 来 说 要 高 一 
些 ， 所 以 对 于 需要 应 用 indexof () 和 substring () 这 两 个 方法 的 应 用 场 
景 ， 建 议 使 用 stringtokenizer 代 替 。 


3.3.6 字符 串 重 编码 


计算 机 中 储存 的 信息 都 是 用 二 进 制 数 表 示 的 ; 而 我 们 在 屏幕 上 看 
到 的 英文 、 汉 字 等 字符 是 二 进 制 数 转换 之 后 的 结果 。 通 俗 的 说 ， 按 照 
何 种 规则 将 字符 存储 在 计算 机 中 ， 如 用 什么 表示 ， 称 为 “编码 "; 反 
之 ， 将 存储 在 计算 机 中 的 二 进 制 数 解析 显示 出 来 ， 称 为 “解码 *"”， 如 同 
密码 学 中 的 加 密 和 解密 。 在 解码 过 程 中 ， 如 果 使 用 了 错误 的 解码 规 
则 ， 则 导致 ‘a 解析 成 ‘b: 或 者 乱码 。 

字符 集 (Charset) : 是 一 个 系统 支持 的 所 有 抽象 字符 的 集合 。 字 
符 是 各 种 文字 和 符号 的 总 称 ， 包 括 各 国家 文字 、 标 点 符号 、 图 形 符 
号 、 数 字 等 。 

字符 编码 (Character Encoding) : 是 一 套 法 则 ， 使 用 该 法 则 能 
对 自然 语言 的 字符 的 一 个 集合 〈 如 字母 表 或 音节 表 ) ， 与 其 他 东西 的 
一 个 集合 (如 号 码 或 电 脉冲 ) 进行 配对 。 即 在 符号 集合 与 数字 系统 之 
间 建 立 对 应 关系 ， 它 是 信息 处 理 的 一 项 基本 技术 。 通 常人 们 用 符号 
合 (一 般 情况 下 就 是 文字 ) 来 表达 信息 。 而 以 计算 机 为 基础 的 信息 处 
理 系统 则 是 利用 元 件 (硬件 ) 不 同 状态 的 组 合 来 存储 和 处 理 信 息 的 。 
元 件 不 同 状态 的 组 合 能 代表 数字 系统 的 数字 ， 因 此 字符 编码 就 是 将 符 
号 转换 为 计算 机 可 以 接受 的 数字 系统 的 数 ， 称 为 数字 代码 。 

常见 字符 集 名 称 : ASCII 字 符 集 、GB2312 字 符 集 、BIG5 字 符 集 、 
GB18030 字 符 集 、Unicode 字 符 集 等 。 计 算 机 要 准确 的 处 理 各 种 字符 集 
文字 ， 需 要 进行 字符 编码 ， 以 便 计算 机 能 够 识别 和 存储 各 种 文字 。 


代码 清单 3-86 所 示 的 范例 说 明了 怎么 可 以 正确 地 对 字符 集 进 行 转 
码 。 代 码 清单 3-87 是 程序 运行 的 输出 。 


代码 清单 3-86 ”字符 串 重 编码 实验 


import java.io.UnsupportedEncodingException; 


/** 

* 字符 串 转 码 测试 

" 

public class TestEncoding { 

/1 如 果 出 现 缺 少 字符 集 的 情况 ， 抛 出 字符 编码 异常 

/ [UTF-8 (8-bit Unicode Transformation Format ) 是 一 种 针对 Unicode 的 可 变 长 度 字符 编码 ( 定 
长 码 ) 也 是 一 种 前 缓 码 。 它 可 以 用 来 表示 Unicode 标准 中 的 任何 字符 ， 且 其 编码 中 的 第 一 个 字 节 仍 与 RSCII 兼 
容 ， 这 使 得 原来 处 理 ASCII 字符 的 软件 无 须 或 只 需 做 少 部 分 修改 ， 即 可 继续 使 用 ， 因 此 ， 它 逐渐 成 为 电子 邮件 、 
网 页 及 其 他 存储 或 传送 文字 的 应 用 中 ， 优 先 采 用 的 编码 。 互 联网 工程 工作 小 组 ( IETF ) 要 求 所 有 互联 网 协议 都 必 
须 支持 UTF-8 编码 。 


public static void main(String[] args) throws UnsupportedEncodingException { 
System.out .println(" 转 码 前 ， 给 出 Java 系统 属性 如 下 : "); 

System.out.println("user.country:" + System.getProperty("user.country")); // 打 印 国家 

System.out.println("user.language:" + System.getProperty("user.language")); // 打 印 语 


ud 


System.out.println("sun.jnu.encoding:" + System.getProperty("sun.jnu.encoding")); // 打 印字 
符 集 

System.out.println("file.encoding:" + System.getProperty("file.encoding")); // 打 印字 
符 集 


System.out .Println (" 转 码 之 后 的 输出 : "); 

String s = "44A"; 

String sl = new String(s.getBytes(), "UTF-8"); 

String s2 = new String(s.getBytes("UTF-8"), "UTF-8"); // 如 果 你 转 码 之 后 ， 
又 用 该 码 来 构建 一 个 字符 串 ， 是 绝对 不 会 出 现 乱 码 的 

String s3 = new String(s.getBytes ("UTF-8")); 

String s4 - new String(s.getBytes("UTF-8"), "GBK"); 

String s5 = new String(s.getBytes ("GBK")); 

String s6 = new String(s.getBytes("GBK"), "GBK"); 

System.out.println(s1); // 输 出 乱码 

System.out.println(s2); // 输 出 正确 的 中 文 

System.out.println(s3); // 输 出 乱码 

System.out.println(s4); // 输 出 乱码 

System.out.println(s5); // 输 出 正确 的 中 文 

System.out.println(s6); // 输 出 正确 的 中 文 


代码 清单 3-87 ”字符 串 重 编码 实验 运行 输出 
转 码 前 ， 输 出 Java RABAT: 
转 码 前 ， 输 出 Java RABAT: 
user.country:CN 
user.language:zh 
sun.jnu.encoding:GBK 
file.encoding:GBK 
转 码 之 后 的 输出 : 


A~ Riso? 
麦克 周 
麦克 周 


3.3.7 合并 字符 串 


由 于 String 是 不 可 变 对 象 ， 因 此 ， 在 需要 对 字符 串 进行 修改 操作 时 
(如 字符 串 连 接 、 替 换 ) ，String 对 象 会 生成 新 的 对 象 ， 所 以 其 性 能 相 
对 较 差 。 但 是 JVM 会 对 代码 进行 彻底 的 优化 ， 将 多 个 连接 操作 的 字符 
串 在 编译 时 合成 一 个 单独 的 长 字符 串 。 

针对 超大 的 Sting 对 象 ， 我 们 采用 String 对 象 连接 、 使 用 concat 方 法 
连接 、 使 用 StringBuilder 类 等 三 种 方式 ， 代 码 如 清单 3-88 所 示 。 


代码 清单 3-88 合并 字符 串 实验 
public class StringConcat { 
public static void main(String[] args) { 
String str - null; 


String result = ""; 


long start - System.currentTimeMillis(); 
for(int i=0;1<10000;i++) { 
str = str + ij 
} 
long end = System.currentTimeMillis(); 


System.out.println(end-start); 


start = System.currentTimeMillis(); 
for(int i1=0;1<10000;i++) { 
result = result.concat (String. valueOf (i)); 
} 
end = System.currentTimeMillis(); 


System.out.println(end-start); 


start = System.currentTimeMillis(); 
StringBuilder sb = new StringBuilder(); 
for(int i=0;1<10000; i++) { 

sb.append (i); 
} 
end = System.currentTimeMillis(); 


System.out.println(end-start) ; 


代码 清单 3-89 合并 字符 串 实验 运行 输出 
375 


虽然 第 一 种 方法 时 编译 器 判断 String 的 激发 运行 成 StringBuilder 实 
现 ， 但 是 编译 器 没有 做 出 足够 聪明 的 判断 ， 每 次 循环 都 生成 了 新 的 
StringBuilder 实 例 从 而 大 大 降低 了 系统 性 能 。 

StringBuffer 和 StringBuilder 都 实现 了 AbstractStringBuilder 抽 象 类 ， 
拥有 几乎 相同 的 对 外 借口 ， 两 者 的 最 大 不 同 在 于 StringBuffer 对 几乎 所 
有 的 方法 都 做 了 同步 ， 而 StringBuilder 并 没有 任何 同步 。 由 于 方法 同步 
需要 消耗 一 定 的 系统 资源 ， lE, StringBuilder 的 效率 也 好 于 
StringBuffer。 但 是 ， 在 多 线程 系统 中 ，StringBuilder 无 法 保证 线程 安 
全 ， 不 能 使 用 。 无 论 StringBuilder 还 是 StringBuffer， 底 层 使 用 的 数据 存 
储 都 是 char[]。 随 着 新 元 素 不 断 加 入 StringBuilder 或 StringBuffer， 底 层 的 
数据 存储 char[] 的 大 小 也 需要 随 之 调整 。 大 小 调整 的 结果 是 字符 数组 
char[] 分 配 到 了 一 块 更 大 空间 创建 新 的 字符 数组 char[]， 老 数组 中 的 字符 
元 素 被 复制 到 了 新 的 数组 之 中 ， 而 原 有 的 老 数组 则 被 丢弃 ， 即 这 部 分 
资源 会 进行 垃圾 收集 。 底 层 使 用 数组 存储 数据 的 Java Collection 类 ， 也 
采用 类 似 的 方法 管理 内 存 。 


代码 清单 3-90 StringBuffer 和 StringBuilder 对 比 实验 
public class StringBufferandBuilder { 
public StringBuffer contents = new StringBuffer(); 
public StringBuilder sbu = new StringBuilder(); 


public void log(String message) { 
for(int i=0;i<10;i++) { 
contents.append (i); 
contents.append("\n") ; 
sbu.append (i) ; 
sbu.append("\n"); 


} 

public void getcontents () { 
System.out.println("start print StringBuffer") ; 
System.out.println (contents); 
System.out.println("end print StringBuffer"); 

) 

public void getcontents1()(í 
System.out.println("start print StringBuilder"); 
System.out.println(sbu); 
System.out.println("end print StringBuilder"); 


public static void main(String[] args) throws InterruptedException { 
StringBufferandBuilder ss - new StringBufferandBuilder(); 
runthread tl = new runthread(ss,"love"); 
runthread t2 = new runthread(ss,"apple"); 
runthread t3 - new runthread(ss,"egg"); 
ti.start(); 
t2.start(); 
t3.start(); 
tl.join(); 
E2 JOE)? 
£3.join(); 


class runthread extends Thread{ 
String message; 
StringBufferandBuilder buffer; 
public runthread(StringBufferandBuilder buffer,String message) { 


this.buffer = buffer; 
this.message - message; 
) 
public void run()( 
while (true) { 
buffer. log (message); 
/ louffer.getcontents (); 
buffer.getcontentsl(); 
try { 
sleep (5000000) ; 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


代码 清单 3-91 StringBuffer 和 StringBuilder 对 比 实验 运行 输出 
start print StringBuffer 
0123456789 
end print StringBuffer 
start print StringBuffer 
start print StringBuilder 
01234567890123456789 
end print StringBuffer 
start print StringBuilder 
01234567890123456789 
01234567890123456789 
end print StringBuilder 
end print StringBuilder 
start print StringBuffer 
012345678901234567890123456789 
end print StringBuffer 
start print StringBuilder 
012345678901234567890123456789 
end print StringBuilder 


可 以 看 出 ，StringBuilder 数 据 并 没有 按照 预想 的 方式 。 

StringBuilder 和 StringBuffer 的 扩充 策略 是 构造 器 会 创建 一 个 默认 大 
小 (通常 是 16) 的 字符 数组 。 在 使 用 中 ， 如 果 超 出 这 个 大 小 ， 就 会 重 
新 分 配 内 存 ， 创 建 一 个 更 大 的 数组 ， 并 将 原先 的 数组 复制 过 来 ， 再 丢 
弃 旧 的 数组 。 将 原 有 的 容量 大 小 翻 倍 ， 以 新 的 容量 申请 内 存 空 间 ， 建 
立新 的 char 数 组 ， 然 后 将 原 数组 中 的 内 容 复 制 到 这 个 新 的 数组 中 。 
此 ， 对 于 较 大 对 象 的 扩容 会 涉及 大 量 的 内 存 复制 操作 。 如 果 能 够 预先 
评估 大 小 ， 会 提高 性 能 。 

StringBuffer 的 构造 器 会 创建 一 个 默认 大 小 (通常 是 16) 的 字符 数 
组 。 在 使 用 中 ， 如 果 超 出 这 个 大 小 ， 就 会 重新 分 配 内 存 ， 创 建 一 个 更 
大 的 数组 ， 并 将 原先 的 数组 复制 过 来 ， 再 丢弃 旧 的 数组 。 在 大 多 数 情 
况 下 ， 你 可 以 在 创建 StringBuffer 的 时 候 指 定 大 小 ， 这 样 就 避免 了 在 容 
量 不 够 的 时 候 自 动 增长 ， 以 提高 性 能 。 

如 代码 3-92 所 示 ， 我 们 为 StringBuffer 提 供 设 定 的 大 小 。 


代码 清单 3-92 irse StringBuffer 的 大 小 
public class StringBufferDemo[ 
void method () | 
stringbuffer buffer = new stringbuffer (max); 
buffer.append ("hello"); 
} 
private final int max = 100; 


} 


StringBuffer 与 StringBuilder 的 区 别 在 于 ，java.lang.StringBuffer 是 线 
程 安全 的 可 变 字 符 序 列 ， 它 是 一 个 类 似 于 String 的 字符 串 缓冲 区 ， 但 是 
不 支持 修改 。 StringBuilder 与 该 类 相 比 ， 通 常 应 该 优先 使 用 
StringBuilder 类 ， 因 为 她 支持 所 有 相同 的 操作 ， 但 由 于 她 不 执行 同步 ， 
所 以 速度 更 快 。 为 了 获得 更 好 的 性 能 ， 在 构造 StringBuffer 或 
StringBuilder 时 应 尽量 指定 她 的 容量 。 当 然 如 果 不 超过 16 个 字符 时 就 不 
用 了 。 一 般 来 说 ， 相 同 场景 情况 下 ， 我 们 使 用 StringBuilder 比 使 用 
StringBuffer 仅 能 获得 10%~15% 的 性 能 提升 ， 但 却 要 冒 多 线程 不 安全 的 
风险 。 综 合 考虑 还 是 建议 使 用 StringBuffer。 


如 果 你 是 依靠 Java 编 译 器 来 隐 了 式 生成 实例 的 话 ， 那 么 编译 的 效果 几 
乎 和 是 否 使 用 了 StringBuilder 实 例 富 无 关系 。 每 次 CPU 的 循环 的 时 间 都 
白白 耗费 在 GC 或 者 为 StringBuilder 分 配 默认 空间 上 。 一 般 来 说 ， 使 用 
StringBuilder 的 效果 要 优 于 使 用 + 操作 符 。 如 果 可 能 的 话 请 在 需要 跨 多 
个 方法 传递 引用 的 情况 下 选择 StringBuilder， 因 为 String 要 消耗 额外 的 
资源 ， 而 StringBuilder 总 体 来 说 要 优 于 StringBuffer。 


3.3.8 正则 表达 式 不 是 万 能 的 


正则 表达 式 给 我 们 的 印象 是 非常 快 ， 如 果 万 不 得 已 非 要 在 计算 密 
集 型 代码 中 使 用 正则 表达 式 的 话 ， 至 少 要 将 Pattern 缓 存 下 来 ， 避 免 反复 
编译 Pattern。 

static final Pattern HEAVY REGEX = Pattern.compile("(((X)*Y)*Z)*"); 


如 果 仅 使 用 到 了 例如 String[] parts=ipAddress.split ("\\."") ; 这 样 
简单 的 正则 表达 式 的 话 ， 最 好 还 是 用 普通 的 char[] 数 组 或 者 是 基于 索引 
的 操作 ， 比 如 下 面 这 段 可 读 性 比较 差 的 代码 其 实 起 到 了 相同 的 作用 。 


代码 清单 3-93 车 换 正则 表达 式 代码 
int length = ipAddress.length(); 
int offset = 0; 
int part - 0; 
for (int i = 0; i < length; i++) { 
if (1 == length - 1 || 
ipAddress.charAt(i + 1) == '.') { 
parts[part] = 


ipAddress.substring(offset, i + 1); 
parttt; 
offset = i + 2; 


虽然 与 split () 方法 相 比 较 ， 这 段 代 码 的 可 维护 性 比较 差 ， 但 是 它 
们 的 执行 效率 一 样 ， 所 以 说 也 并 不 是 非得 优化 ， 当 然 这 最 终 还 是 要 看 
程序 员 的 理解 了 。 


3.4 引用 类 型 概念 


我 在 网 上 看 到 过 某 位 程序 员 的 留言 :“ 之 所 以 想 学 习 一 下 Java 的 几 
种 引用 类 型 ， 原 因 有 两 个 : 

(1) 理解 Java Cache 实 现 、 学 习 Java 引 用 与 Java 垃 圾 回收 机 制 的 关 
系 ， 内 存 资 产 是 有 限 的 ， 需 要 合理 的 利用 。Cache 不 是 仅仅 HashMap 那 
么 简单 ，Java 引 | 用 与 Java 垃 圾 回收 机 制 也 有 非常 紧密 的 关系 。 

(2) 避免 对 Java5 引 用 的 错误 使 用 ， 某 个 同事 把 5000+ 交 易 数 据 放 到 
一 个 HashMap & ifj, FH— f Spring Singleton Bean 的 全 局 属性 指向 该 
HashMap。 大 量 运用 这 种 技术 ， 很 快 就 报 out of memory. 有 再 大 的 内 存 也 
架 不 住 对 内 存 的 错误 使 用 。 理 解 原理 有 助 于 我 们 尽量 少 犯 或 不 犯 低 级 
错误 。” 

这 一 小 节 就 被 用 来 回答 网 友 的 这 个 问题 。 

当 Java 虚 拟 机 觉得 内 存 不 够 用 的 时 候 ， 会 触发 垃圾 回收 操作 

(GC) ， 清 除 无 用 的 对 象 ， 释 放 内 存 。 可 是 如 何 判断 一 个 对 象 是 否 是 
垃圾 呢 ? 其 中 的 一 个 方法 是 计算 指向 该 对 象 的 引用 数量 ， 如 果 引 用 数 
量 为 0， 那 么 该 对 象 就 为 垃圾 (Thread 对 象 是 例外 ) ， 否 则 还 有 用 处 ， 
不 能 被 回收 。 但 是 如 果 把 引用 数 为 0 的 对 象 都 回收 了 ， 还 是 不 能 满足 内 
存 需 求 怎么 办 ? 我 们 在 这 一 节 简 单 描述 一 下 ， 具 体会 在 第 7 章 详 细 深 入 
讨论 。 

在 很 多 时 候 ， 一 个 对 象 并 不 是 从 根部 直接 引用 的 ， 而 是 一 个 对 象 
被 其 他 对 象 引 用 ， 甚 至 同时 被 几 个 对 象 所 引用 ， 从 而 构成 一 个 以 根 集 
为 顶 的 树 形 结构 。 在 JDK1.2 以 前 的 版 本 中 ， 当 一 个 对 象 不 被 任何 变量 
引用 ， 那 么 程序 就 无 法 再 使 用 这 个 对 象 。 也 就 是 说 ， 只 有 对 象 处 于 可 
触及 状态 ， 程 序 才能 使 用 它 。 这 就 像 在 日 常生 活 中 ， 从 商店 购买 了 某 
样 物品 后 ， 如 果 有 用 ， 就 一 直 保 留 它 ， 否 则 就 把 它 扔 到 垃圾 箱 ， 由 清 
洁 工 人 收 走 。 一 般 说 来 ， 如 果 物 品 已 经 被 扔 到 垃圾 箱 ， 想 再 把 它 捡 回 
来 使 用 就 不 可 能 了 。 但 有 时 候 情 况 并 不 这 么 简单 ， 你 可 能 会 遇 到 类 似 


鸡肋 一 样 的 物品 ， 食 之 无 味 ， 弃 之 可 异 。 这 种 物品 现在 已 经 无 用 了 ， 
保留 它 会 占 空 间 ， 但 是 立刻 扔 掉 它 也 不 划算 ， 因 为 也 许 将 来 还 会 派 用 
场 。 对 于 这 样 的 可 有 可 无 的 物品 ， 一 种 折 中 的 处 理 办 法 是 : 如 果 家 里 
空间 足够 ， 就 先 把 它 保留 在 家 里 ， 如 果 家 里 空间 不 够 ， 即 使 把 家 里 所 
有 的 垃圾 清除 ， 还 是 无 法 容纳 那些 必 不 可 少 的 生活 用 品 ， 那 么 再 扔 掉 
这 些 可 有 可 无 的 物品 。 

垃圾 收集 可 能 是 使 您 感到 难于 理解 的 较 难 的 概念 之 一 ， 因 为 它 并 
不 能 总 是 坚 无 遗漏 地 解决 Java 运 行 时 环境 中 堆 管 理 的 问题 。 假 设 我 们 正 
面 遭 遇 了 内 存 耗 尽 的 错误 ， 我 们 在 尝试 了 一 些 工 具 检 测 没 有 发 现 问题 
时 ， 我 们 很 容易 想到 另外 一 个 比较 可 信 的 原因 ， 即 这 是 Java 虚 拟 机 堆 管 
理 的 问题 ， 而 不 会 认为 这 是 自己 的 程序 的 缘故 。 但 是 事实 是 ，Java 虚 拟 
机 并 不 存在 任何 被 证 实 的 对 象 泄漏 问题 。 实 践 证 明 ， 垃 圾 收集 器 一 般 
能 够 精确 地 判断 哪些 对 象 可 被 收集 ， 并 且 重 新 收回 它们 的 内 存 空间 给 
Java 庶 拟 机 。 所 以 ， 如 果 我 们 遇 到 了 内 存 耗 尽 的 错误 ， 那 么 这 完全 可 能 
是 由 我 们 的 程序 造成 的 ， 也 就 是 说 程序 中 存在 着 “无 意识 的 对 象 保留 
(unintentional object retention) "s 

内 存 港 漏 和 无 意识 的 对 象 保 留 的 区 别 是 什么 呢 ? 对 于 用 Java 语 言 编 
与 的 程序 来 说 ， 确 实 没 有 区 别 。 两 者 都 是 指 在 您 的 程序 中 存在 一 些 对 
象 引 用 ， 但 实际 上 我 们 并 不 需要 引用 这 些 对 象 。 一 个 典型 的 例子 是 向 
一 个 集合 中 加 入 一 些 对 象 以 便 以 后 使 用 它们 ， 但 是 却 志 了 在 使 用 完 以 
后 从 集合 中 删除 这 些 对 象 。 因 为 集合 可 以 无 限制 地 扩大 ， 并 且 从 来 不 
会 变 小 ， 所 以 当 我 们 在 集合 中 加 入 了 太 多 的 对 象 (或 者 是 有 很 多 的 对 
象 被 集合 中 的 元 素 所 引用 ) 时 ， 就 会 因为 堆 的 空间 被 填 满 而 导致 内 存 
耗 尽 的 错误 。 垃 圾 收集 器 不 能 收集 这 些 我 们 认为 已 经 用 完 的 对 象 ， 因 
为 对 于 垃圾 收集 器 来 说 ， 应 用 程序 仍然 可 以 通过 这 个 集合 在 任何 时 候 
访问 这 些 对 象 ， 所 以 这 些 对 象 是 不 可 能 被 当 作 垃圾 的 。 

对 于 没有 垃圾 收集 的 语言 来 说 ， 例 如 C++， 内 存 泄 漏 和 无 意识 的 对 
象 保 留 是 有 区 别 的 。C++ 程 序 跟 Java 程 序 一 样 ， 可 能 产生 无 意识 的 对 象 
保留 。 但 是 C++ 程序 中 存在 真正 的 内 存 泄漏 ， 即 应 用 程序 无 法 访问 一 些 
对 象 以 至 于 被 这 些 对 象 使 用 的 内 存 无 法 释放 且 返 还 给 系统 。 令 人 欣慰 
的 是 ， 在 Java 程 序 中 ， 这 种 内 存 泄漏 是 不 可 能 出 现 的 。 所 以 ， 我 们 更 喜 
欢 用 “无 意识 的 对 象 保留 ”来 表示 这 个 令 Java 程 序 员 抓 破 头 皮 的 内 存 问 
题 。 这 样 ， 我 们 就 能 区 别 于 其 他 使 用 没有 垃圾 收集 语言 的 程序 员 。 


那么 当 发 现 了 无 意识 的 对 象 保 留 该 怎么 办 呢 ? 首先 ， 需 要 确定 哪 
些 对 象 是 被 无 意 保留 的 ， 并 且 需 要 找到 究竟 是 哪些 对 象 在 引用 它们 。 
然后 必须 安排 好 应 该 在 哪里 释放 它们 。 最 容易 的 方法 是 使 用 能 够 对 堆 
产生 快照 的 检测 工具 来 标识 这 些 对 象 ， 比 较 堆 的 快照 中 对 象 的 数目 ， 
跟踪 这 些 对 象 ， 找 到 引用 这 些 对 象 的 对 象 ， 然 后 强制 进行 垃圾 收集 。 
有 了 这 样 一 个 检测 器 ， 接 下 来 的 工作 相对 而 言 就 比较 简单 了 : 

(1) 等 待 直到 系统 达到 一 个 稳定 的 状态 ， 这 个 状态 下 大 多 数 新 产 
生 的 对 象 都 是 暂时 的 ， 符 合 被 收集 的 条 件 ; 这 种 状态 一 般 在 程序 所 有 
的 初始 化 工作 都 完成 了 之 后 。 

(2) 强制 进行 一 次 垃圾 收集 ， 并 且 对 此 时 的 堆 做 一 份 对 象 快照 。 

(3) 进行 任何 可 以 产生 无 意 地 保留 的 对 象 的 操作 。 

(4) 再 强制 进行 一 次 垃圾 收集 ， 然 后 对 系统 堆 中 的 对 象 做 第 二 次 
对 象 快照 。 

比较 两 次 快照 ， 看 看 哪些 对 象 的 被 引用 数量 比 第 一 次 快照 时 增加 
了 。 因 为 在 快照 之 前 强制 进行 了 垃圾 收集 ， 那 么 剩 下 的 对 象 都 应 该 是 
被 应 用 程序 所 引用 的 对 象 ， 并 且 通 过 比较 两 次 快照 我 们 可 以 准确 地 找 
出 那些 被 程序 保留 的 、 新 产生 的 对 象 。 根 据 我 们 对 应 用 程序 本 身 的 理 
解 ， 并 且 根 据 对 两 次 快照 的 比较 ， 判 断 出 哪些 对 象 是 被 无 意 保留 的 。 
跟踪 这 些 对 象 的 引用 链 ， 找 出 究竟 是 哪些 对 象 在 引用 这 些 无 意 地 保留 
的 对 象 ， 直 到 您 找到 了 那个 根 对 象 ， 它 就 是 产生 问题 的 根源 。 

Java 中 提供 了 4 个 级 别 的 引用 ， 即 强 引 用 (FinalReference) 、 软 引 
用 (SoftReference ) . 55 5| FH. ( WeakReference ) . mE 引用 

(PhantomReference) 这 四 个 级 别 。 在 这 4 个 级 别 中 只 有 强 引 用 类 是 包 
内 可 见 的 ， 其 他 3 种 引用 类 型 均 为 public， 可 以 在 应 用 程序 中 直接 使 
用 ， 垃 圾 回收 器 会 尝试 回收 只 有 弱 引 用 的 对 象 。 

m 强 引 用 (Strong Reference) : 在 一 个 线程 内 ， 无 须 引用 直接 可 以 
使 用 的 对 象 ， 强 引用 不 会 被 JVM 清 理 。 我 们 平时 申明 变量 使 用 的 就 是 
强 引用 ， 普 通 系 统 99% 以 上 都 是 强 引 用 ， 比 如 ，String s=" Hello World 


Oo 


m 软 引 用 (WeakReference) : 通过 一 个 软 引 用 申明 ，JVM 抛 出 
OOM 之 前 ， 清 理 所 有 的 软 引 用 对 象 。 垃 圾 回收 器 某 个 时 刻 决 定 回 收 软 


可 达 的 对 象 的 时 候 ， 会 清理 软 引 用 ， 并 可 选 的 把 引用 存放 到 一 个 引用 
队列 (ReferenceQueue) 。 

m 555|FH (SoftReference) : 通过 一 个 弱 引 用 申明 。 类 似 弱 引用 ， 

只 不 过 Java 虚拟 机 会 尽量 让 软 引用 的 存活 时 间 长 一 些 ， 迫 不 得 已 才 清 
理 。 
S ESIA (PhantomReference) : 通过 一 个 虚 引 用 申明 。 仅 用 来 处 
里 资源 的 清理 问题 ， 比 Object 里 面 的 finalize 机 制 更 灵活 。get 方 法 返回 的 
Breda Java 虚 拟 机 不 负责 清理 虚 引 用 ， 但 是 它 会 把 虚 引 用 放 到 引 
用 队列 里 面 。 

在 看 具体 各 类 引用 类 型 深入 学 习 之 前 ， 我 们 来 看 一 个 例子 ， 这 个 
aar a i 相同 的 代码 却 有 
不 同 的 结 一 个 抛 出 了 OOM 异 常 ， 另 一 个 则 没有 抛 出 异常 ， 让 我 们 
步 加 深 印 象 。 


代码 清单 3-94 使 用 HashMap 测试 OOM 异常 


import java.util.HashMap; 


public class HashMapOOM { 
public static void main(String[] args) { 
HashMap<String, String> list = new HashMap<String, String>(); 
long i = 1; 
while (i < 100000000L) { 
list.put ( 
String.valueOf (i), 
"JDJJDJJJJJJJJJJ$$$$$555JJJJJJJJJJJJJJJKKKKKKKKKKKKKKKKKJJJJJJ" 
"JJJKKKKKHDDDJDJDJDJDJDJDJDJJDJDJDJDJDJDJJDJDJDJDJJDJDJJJJJJJJJ" 
+ "JJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJ" 
+ "JJJJJJJJJJJJJJJJJJJJJJJJJJJJ") ; 
// 测试 第 一 个 是 否 依然 存活 
if (i % 100000 == 0) { 
System.out.println(list.get (String.valueOf(1))); 


代码 清单 3-95 使 用 HashMap 测试 OOM 异常 运行 输出 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 
at java.lang.Long.toString (Unknown Source) 
at java.lang.String.valueOf (Unknown Source) 
at HashMapOOM.main (HashMapOOM. java :10) 


代码 清单 3-96 ”使 用 WeakHashMap 测试 OOM 异常 


import java.util.WeakHashMap; 


public class WeakHashMapOOM { 
public static void main(String[] args) ( 
WeakHashMap<String, String> list = new WeakHashMap<String, String>(); 
long i = 1; 
while (i < 100000000L) { 
list. put ( 
String.valueOf (i), 
"JDJJDJJJJJJJJJJS $$$$$$$0JJJJJJJJJJJUUUKKKKKKKKKKKKKKREKJUJJJJJ" 
+ "JJJKKKKKHDDDJDJDJDJDJDJDJDJJDJDJDJDJDJDJJDJDJDJDJJDJDJJJJJJJJJ" 
+ "JJJJJJJJJJJJJJJJJJJJJJJJJJJIJJJJJJJJJJIJIJJJIJJJJJJIJJJJJIJJJJJ" 
t "JJJJJJJJJJJJJJJJJJJJJJJJJJJJ" ) ; 
// 测试 第 一 个 是 否 依然 存活 
if (i $ 100000 == 0) { 
System.out.println(list.get (String.valueOf(1))); 


代码 清单 3-94、3-95、3-96 在 运行 一 段 时 间 后 都 没有 抛 出 OOM 异 
常 ， 所 以 证 明 WeakHashMap 是 针对 强 引 用 的 一 个 补充 ， 避 人 免 出 现 内 存 
泄漏 异常 ， 后 面 会 详细 介绍 WeakHashMap。 


3.4.1 强 引 用 (Strong Reference) 


Java 中 的 引用 ， 有 点 像 C++ 的 指针 。 通 过 引用 ， 可 以 对 堆 中 的 对 象 
进行 操作 。 在 Java 程 序 中 ， 最 常见 的 引用 类 型 是 强 引 用 ， 它 也 是 默认 的 
引用 类 型 。 当 在 Java 语 言 中 使 用 new 操 作 符 创 建 一 个 新 的 对 象 ， 并 将 其 
赋值 给 一 个 变量 的 时 候 ， 这 个 变量 就 成 为 指向 该 对 象 的 一 个 强 引用 。 
在 前 面 提 到 过 ， 判 断 一 个 对 象 是 否 存活 的 标准 为 是 否 存在 指向 这 个 对 
RSHA. RAAR, HA: StringBuffer str=new StringBuffer 

(“Hello World”) ; 假设 该 代码 是 在 函数 体内 运行 的 ， 那 么 局 部 变量 str 


将 被 分 配 在 栈 中 ， 而 对 象 StringBuffer 实 例 ， 被 分 配 在 堆 上 。 局 部 变量 
str 指 向 StringBuffer 实 例 所 在 堆 空 间 ， 通 过 str 可 以 操作 该 实例 ， 那 么 str 
就 是 StringBuffer 的 引用 。 此 时 ， 如 果 运 行 一 个 赋值 语句 : StringBuffer 
stri-str; 那么 ，str 所 指向 的 对 象 也 将 被 str1 所 指向 ， 同 时 在 局 部 栈 空间 
上 会 分 配 空间 存放 str1 变 量 。 此 时 ，StringBuffer 实 例 就 有 两 个 引用 。 对 
引用 的 “==” 操 作用 于 表示 两 个 操作 数 所 指向 的 堆 空 间 地 址 是 否 相同 ， 
不 表示 两 个 操作 数 所 指向 的 对 象 是 否 相等 。 

上 例 中 的 两 个 引用 都 是 强 引 用 ， 强 引用 具备 以 下 特点 : 

(1) 强 引 用 可 以 直接 访问 目标 对 象 。 

(2) 强 引 用 所 指向 的 对 象 在 任何 时 候 都 不 会 被 系统 回收 。JVM 宁 
愿 抛 出 Out Of Memory 异 常 也 不 会 回收 强 引 用 所 指向 的 对 象 。 

(3) 强 引 用 可 能 导致 内 存 泄漏 。 

垃圾 回收 器 可 能 采取 不 同 的 算法 来 判断 对 象 的 引用 是 否 存在 。 一 
个 常见 的 做 法 是 使 用 引用 计数 器 。 当 有 新 的 引用 指向 某 个 对 象 时 ， 把 
该 计数 器 的 值 加 1; 当 一 个 引用 失效 时 ， 就 把 该 计数 器 的 值 威 1。 例 
如 ， 显 式 地 把 一 个 引用 某 个 对 象 的 值 变 为 0 的 时 候 ， 说 明 不 存在 任何 指 
向 该 对 象 的 引用 ， 该 对 象 可 以 被 垃圾 回收 器 回收 。5 引 用 计数 器 的 原理 
比较 简单 ， 但 是 实现 起 来 需要 编译 器 的 支持 ， 另 外 使 用 引用 计数 器 不 
能 解决 循环 引用 孤岛 的 回收 问题 。 比 如 ， 三 个 对 象 之 间 互 相 存 在 引用 
关系 ， 但 是 并 不 存在 指向 这 三 个 对 象 的 其 他 引用 ， 这 三 个 对 象 实际 上 
就 成 为 了 内 存 区 域 中 的 一 个 孤岛 。 这 三 个 对 象 的 引用 计数 器 的 值 都 不 
为 0， 因 此 无 法 通过 引用 计数 器 的 方式 来 回收 。 

由 于 引用 计数 器 存在 无 法 处 理 * 孤 岛 ” 的 问题 ，Java 虚 拟 机 的 垃圾 回 
收 器 没有 采用 这 种 做 法 ， 而 是 采取 跟踪 对 象 引 用 的 做 法 。 这 种 做 法 会 
从 虚拟 机 内 存 中 的 某 些 存活 对 象 开 始 ， 递 归 检 查 这 些 对 象 所 引用 的 其 
他 对 象 ， 知 道 找 到 不 引用 其 他 对 象 的 对 象 为 止 。 在 这 个 过 程 中 所 发 现 
的 所 有 对 象 都 会 被 标记 为 存活 的 ， 而 其 他 对 象 则 是 可 以 被 回收 的 。 这 
个 遍历 过 程 的 起 始 对 象 是 一 个 集合 ， 称 之 为 根 集合 。 根 集合 中 一 般 包 
括 系统 类 、 程 序 寄存 器 、JNI 全 局 引用 、 静 态 变量 和 线程 的 当前 活动 栈 
中 的 变量 所 指向 的 对 象 等 。 可 以 将 这 个 跟踪 过 程 看 成 是 基于 引用 关系 
的 树 的 遍历 。 在 跟踪 过 程 中 发 现 的 存活 对 象 被 称 为 可 达 的 。 将 从 遍历 
的 根 节点 到 当前 存活 对 象 的 路 径 称 为 可 达 路 径 。 这 条 路 径 的 边 对 应 的 


是 对 象 之 间 的 引用 。 如 果 一 个 对 象 的 可 达 路 径 中 只 包含 强 引 用 ， 则 把 
这 个 对 象 成 为 强 引 用 可 达 的 。 程 序 中 的 大 多 数 存 活 对 象 都 是 强 引 用 可 
达 的 。 

对 于 垃圾 回收 器 来 说 ， 强 引用 的 存在 会 阻止 一 个 对 象 被 回收 。 在 
垃圾 回收 器 遍历 对 象 引 用 并 进行 标记 之 后 ， 如 果 一 个 对 象 是 强 引 用 可 
达 的 ， 那 么 这 个 对 象 不 会 作为 垃圾 回收 的 候选 。 因 为 该 对 象 仍 然 被 程 
序 所 使 用 ， 回 收 其 内 存 显然 是 一 个 错误 的 做 法 。 虽 然 由 于 垃圾 回收 器 
的 存在 ，Java 虚 拟 机 中 并 不 存在 真正 意义 上 的 内 存 泄漏 ， 但 是 某 些 错误 
的 用 法 会 对 程序 中 所 能 使 用 的 内 存 空 间 造 成 影响 。 这 些 情 况 可 以 看 成 
是 另外 一 种 意义 上 的 内 存 泄 露 ， 这 些 内 存 泄 露 的 发 生 也 都 和 强 引 用 的 
使 用 有 关 。 

总 的 来 说 ， 在 我 们 的 应 用 程序 代码 中 使 用 的 大 部 分 引用 实际 上 都 
是 强 引 用 ， 强 引用 是 使 用 最 普遍 的 引用 。 如 果 一 个 对 象 具有 强 引 用 ， 
那 垃 圾 回收 器 绝 不 会 回收 它 。 当 内 存 空间 不 足 ，Java 虚 拟 机 宁愿 抛 出 
OutOfMemoryError 错 误 ， 使 程序 异常 终止 ， 也 不 会 靠 随意 回收 具有 强 
引用 的 对 象 来 解决 内 存 不 足 的 问题 。 

比如 下 面 这 段 代 码 中 的 object 和 str 都 是 强 引 用 : 


20bject object = new Object(); 
String str = "hello"; 


前 面 说 过 ， 只 要 某 个 对 象 有 强 引 用 与 之 关联 ，JVM 必 定 不 会 回收 
这 个 对 象 ， 即 使 在 内 存 不 足 的 情况 下 ，JVM 宁 愿 抛 出 OutOfMemory 错 
误 也 不 会 回收 这 种 对 象 ， 比 如 清单 3-97 所 示 代 码 。 


代码 清单 397 强 引用 示例 
public class Main { 
public static void main(String[] args) { 


new Main().funl(); 


public void funl() | 
Object object = new Object () ; 
Object[] objArr = new Object [1000]; // 当 运行 至 Object[] objArr = new 
Object [1000] ;这 名 时 ， 如 果 内 存 不 足 ，JVM 会 抛 出 00M 错误 也 不 会 回收 object HAMAR, 


} 


当 fun1 运 行 完 之 后 ，object 和 objArr 都 已 经 不 存在 了 ， 所 以 它们 指 
向 的 对 象 都 会 被 JVM 回 收 。 如 果 想 中 断 强 引用 和 条 个 对 象 之 间 的 关 
联 ， 可 以 显示 地 将 引用 赋值 为 null， 这 样 一 来 JVM 在 合适 的 时 间 就 会 回 
收 该 对 象 。 比 如 Vector 类 的 remove 方 法 中 就 是 通过 将 引用 赋值 为 null 来 
实现 清理 工作 的 。 


代码 清单 3-98 Vector 源码 
/* * 
* Removes the element at the specified position in this Vector. 
* Shifts any subsequent elements to the left (subtracts one from their 


* indices). Returns the element that was removed from the Vector. 


* (throws ArrayIndexOutOfBoundsException if the index is out of range 
, ({@code index < 0 || index >= size()}) 
* @param index the index of the element to be removed 
* @return element that was removed 
* @since 1.2 
ii 
public synchronized E remove(int index) { 
modCountt++; 
if (index >= elementCount) 
throw new ArrayIndexOutOfBoundsException (index); 


Object oldValue = elementData [index]; 


int numMoved = elementCount - index - 1; 
if (numMoved > 0) 
System.arraycopy(elementData, index*l, elementData, index, 
numMoved) ; 
elementData[--elementCount] = null; //GC mikat% 


return (E)oldValue; 


| 


在 实现 一 个 缓存 系统 的 时 候 ， 如 果 全 部 使 用 强 引 用 ， 那 么 你 需 
自己 去 手动 的 把 某 些 引 用 Clear 掉 (引用 置 为 Null) ， 否 则 迟早 会 抛 出 
Out Of Memory 错 误 。 缓 存 系统 引入 弱 引 用 或 者 软 引 用 的 唯一 原因 是 ， 
把 引用 Clear 的 事情 交 由 Java 垃 圾 回收 器 来 处 理 ，Cache 程 序 自己 置身 事 
外 。 


通常 来 说 ， 应 用 程序 内 部 的 内 存 泄露 有 两 种 情况 。 一 种 是 虚拟 机 
中 存在 程序 无 法 使 用 的 内 存 区 域 。 这 些 内 存 区 域 被 程序 中 一 些 无 法 使 
用 的 存活 对 象 占用 。 这 些 对 象 由 于 存在 隐 式 的 强 引 用 ， 无 法 对 其 进行 
垃圾 回收 。 但 是 在 程序 的 正常 运行 过 程 中 ， 这 些 对 象 也 无 法 被 使 用 。 
造成 这 种 问题 的 原因 通常 是 程序 编写 时 的 逻辑 错误 。 另 一 种 情况 是 程 
序 中 存在 大 量 存活 时 间 过 长 的 对 象 。 这 些 对 象 的 存活 时 间 长 于 使 用 它 
们 的 对 象 。 在 正常 情况 下 ， 这 些 对 象 在 引用 它们 的 对 象 被 回收 之 后 ， 
也 应 该 被 回收 ， 但 是 由 于 某 些 程序 中 的 错误 而 没有 被 回收 。 这 些 对 象 
无 法 被 回收 ， 仍 然 占据 着 虚拟 机 中 的 内 存 资源 。 时 间 长 了 ， 虚 拟 机 会 
因为 没有 足够 的 内 存 分 配给 新 的 对 象 而 抛 出 OOM 和 错误。 第 一 种 情况 出 
现 的 实例 代码 如 下 所 示 。 清 单 中 给 出 了 一 个 简单 的 先进 先 出 队列 的 实 
现 。 它 在 内 部 使 用 了 一 个 java.util.List 接 口 的 实现 对 象 来 保存 队列 中 的 
对 象 。 向 队列 中 添加 新 的 对 象 会 被 直接 放 在 List 接 口 实现 对 象 的 末尾 。 
队列 的 队 首位 置 则 由 内 部 变量 topIndex 来 维护 。 每 次 有 对 象 被 移出 队列 
时 ，topIndex 的 值 会 增加 1。 这 个 队列 实现 的 问题 在 于 出 队列 的 方法 只 
简单 地 改变 了 topIndex 的 值 ， 并 没有 把 对 象 从 队列 中 剔除 。 在 经 过 若干 
次 队列 操作 之 后 ，topIndex 的 值 会 逐渐 变 大 。 变 量 backendList 所 指向 的 
对 象 中 包含 的 序号 小 于 topIndex 的 对 象 无 法 被 队列 的 使 用 者 通过 正常 的 
方式 来 访问 。 由 于 backendList 所 指向 的 对 象 仍 然 包 含 指向 这 些 对 象 的 
强 引 用 ， 因 此 这 些 对 象 也 无 法 被 垃圾 回收 ， 这 些 对 象 占用 的 内 存 就 成 
为 虚拟 机 中 无 法 使 用 的 区 域 。 


代码 清单 3-99 先进 先 出 队列 示例 
import java.util.Arraylist; 


import java.util.List; 


public class LeakingQueue<T> { 
private List<T> backendList = new ArrayList<T>(); 
private int topIndex = 0; 
public void enqueue (T value) { 
backendList.add(value) ; 


public T dequeue () { 
T result = backendList.get (topIndex) ; 
topIndext++; 


return result; 


public static void main(String[] args) { 
LeakingQueue lq = new LeakingQueue(); 
for(int i1=0;1<10000000;i++) { 
for(int 3=0;7<10000000; j++) { 
lq.enqueue (1); 


lg.dequeue () ; 


输出 如 清单 3-100 所 示 。 


代码 清单 3-100 先进 先 出 队列 示例 运行 输出 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 
at java.util.Arrays.copyOf (Unknown Source) 
at java.util.Arrays.copyOf (Unknown Source) 
at java.util.ArrayList.grow(Ünknown Source) 


at java.util.ArrayList.ensureExplicitCapacity (Unknown Source) 


at java.util.ArrayList.ensureCapacityInternal (Unknown Source) 


at java.util.ArrayList.add(Unknown Source) 
at LeakingQueue.enqueue (LeakingQueue.java:8) 


at LeakingQueue.main (LeakingQueue.java:21) 


第 二 种 情况 的 典型 情景 发 生 在 使 用 基于 内 存 实现 的 缓存 的 时 候 。 

如 下 代码 利用 calculate 方 法 进行 实际 运算 所 需 的 时 间 可 能 比较 长 ， 因 此 
使 用 了 一 个 java.util.HashMap 类 的 对 象 来 保存 之 前 计算 的 结果 。 在 
calculate 方 法 被 调用 时 ， 会 先 检查 缓存 中 是 否 已 经 存在 之 前 计算 出 来 的 
结果 ， 这 样 可 以 避免 重复 的 计算 ， 进 而 提高 性 能 。 不 过 这 种 做 法 延长 
了 计算 结果 对 象 的 存活 时 间 。 在 不 使 用 缓存 的 情况 下 ， 在 calculate 方 法 
的 调用 者 获得 计算 结果 对 象 ， 并 完成 对 该 对 象 的 使 用 之 后 ， 就 可 以 对 
该 对 象 进 行 垃 圾 回收 。 当 使 用 了 缓存 之 后 ， 计 算 结 果 对 象 的 存活 时 间 
就 变 得 至 少 和 用 来 进行 缓存 的 HashMap 类 的 对 象 一 样 长 。 因 为 HashMap 
类 的 对 象 有 其 所 包含 的 所 有 计算 结果 对 象 的 引用 ， 所 以 ， 只 要 
HashMap 类 的 对 象 无 法 被 回收 ， 其 中 所 包含 的 计算 结果 对 象 也 无 法 被 
回收 。 在 calculate 方 法 被 多 次 调用 之 后 ， 缓 存 中 包含 的 对 象 会 越 来 越 
多 ， 导 致 占用 的 内 存 越 来 越 大 ， 而 程序 中 其 他 部 分 可 用 的 内 存 则 越 来 
越 少 。 


代码 清单 3-101 使 用 HashMap 保存 计算 结果 方法 
import java.util.HashMap; 


import java.util.Map; 


public class Calculator { 
private Map<String,Object> cache = new HashMap«String,Object»(); 
public Object calculate(String expr) { 
if (cache. containsKey (expr) ) { 
return cache.get (expr) ; 
} 
Object result = doCalculate (expr) ; 
cache.put (expr, result); 


return result; 


private Object doCalculate (String expr) { 


return new Object () ; 


public static void main(String[] args) { 
Calculator cal = new Calculator (); 
for (int 1=0;1<10000000;i++) { 


cal.calculate (String.valueOf (i) ); 


} 
代码 3-101 的 运行 输出 如 清单 3-102 所 示 。 


代码 清单 3-102 代码 3-95 运行 输出 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 
at java.lang.Integer.toString(Unknown Source) 
at java.lang.String.valueOf (Unknown Source) 


at Calculator.main(Calculator.java:23) 


从 前 面 两 个 示例 可 以 看 出 ， 强 引用 所 提供 的 与 垃圾 回收 器 的 交互 
功能 非常 有 限 。 当 强 引 用 存在 的 时 候 ， 所 指向 的 对 象 无 法 被 垃圾 回 
收 。 为 了 增强 程序 与 垃圾 回收 器 的 交互 能 力 ，JDK1.25| 入 了 
java.lang.ref 包 ， 提 供 了 3 种 新 的 引用 类 型 ， 分 别 是 软 引 用 、 弱 引用 和 虚 
引用 。 这 些 引 用 类 型 除了 可 以 引用 对 象 之 外 ， 还 可 以 在 不 同 程度 上 影 
响 垃圾 回收 器 对 被 引用 对 象 的 处 理 行为 。 


3.4.2 软 引 用 (Soft Reference) 


首先 ， 我 们 假设 存在 一 个 用 户 信息 查询 系统 的 应 用 场景 ， 用 户 信 
息 查 询 系统 负责 查询 存储 在 磁盘 文件 或 者 数据 库 中 的 用 户 档 案 信息 。 
作为 一 个 该 应 用 程序 的 使 用 者 ， 我 们 完全 有 可 能 需要 回头 去 查看 几 分 
钟 甚至 几 秒 钟 前 查看 过 的 用 户 信 息 (同样 ， 我 们 在 浏览 Web 页 面 的 时 候 
也 经 常会 使 用 < 后 退 ” 按 钮 ) 。 这 时 我 们 通常 会 有 两 种 程序 实现 方式 ， 
一 种 是 把 过 去 查看 过 的 用 户 信息 保存 在 内 存 中 ， 每 一 个 存储 了 用 户 信 
息 的 Java 对 象 的 生命 周期 贯穿 整个 应 用 程序 始终 ， 另 一 种 是 当 使 用 着 开 
始 查看 其 他 用 户 信 息 的 时 候 ， 把 存储 了 当前 所 查看 的 用 户 信息 的 Java 对 
象 结束 引用 ， 使 得 垃圾 收集 线程 可 以 回收 其 所 占用 的 内 存 空间 ， 当 用 
户 再 次 需要 浏览 该 用 户 信息 的 时 候 ， 重 新 构建 该 用 户 的 信息 。 很 显 
然 ， 第 一 种 实现 方法 将 造成 大 量 的 内 存 沪 费 ， 而 第 二 种 实现 的 缺陷 在 
于 即使 垃圾 收集 线程 还 没有 进行 垃圾 收集 ， 包 含 用 户 信息 的 对 象 仍然 
完好 地 保存 在 内 存 中 ， 应 用 程序 也 要 重新 构建 一 个 对 象 。 从 第 2 章 我 们 
知道 ， 访 问 磁盘 文件 、 访 问 网 络 资源 、 查 询 数据 库 等 操作 都 是 影响 应 
用 程序 执行 性 能 的 重要 因素 ， 如 果 能 重新 获取 那些 尚未 被 回收 的 Java 对 
象 的 引用 ， 必 将 减少 不 必要 的 访问 ， 大 大 提高 程序 的 运行 速度 。 

软 引 用 是 除了 强 引 用 外 最 强 的 引用 类 型 ， 我 们 可 以 通过 
java.lang.ref.SoftReference 使 用 软 引 用 。 一 个 持 有 软 引用 的 对 象 ， 它 不 


会 被 JVM 很 快 回收 ，JVM 会 根据 当前 堆 的 使 用 情况 来 判断 何 时 回收 。 
当 堆 使 用 率 临近 阙 值 时 ， 才 会 去 回收 软 引用 的 对 象 。 只 要 有 足够 的 内 
存 ， 软 引用 便 可 能 在 内 存 中 存活 相当 长 一 段 时 间 。 因 此 ， 就 如 上 一 节 
所 说 的 ， 软 引用 可 以 用 于 实现 对 内 存 敏 感 的 Cache。 垃 圾 回收 器 会 保证 
在 抛 出 OOM 错 误 之 前 ， 回 收 掉 所 有 软 引用 可 达 的 对 象 。 通 过 软 引用 ， 
垃圾 回收 器 就 可 以 在 内 存 不 足 时 释放 软 引用 可 达 的 对 象 所 占 的 内 存 空 
间 。 程 序 所 要 做 的 是 保证 软 引 用 可 达 的 对 象 被 垃圾 回收 器 回收 之 后 ， 
程序 也 能 正常 工作 。 在 之 前 介绍 的 图 像 编辑 器 打开 文件 的 示例 中 ， 可 
以 用 强 引 用 指向 当前 正在 编辑 的 图 片 ， 而 用 软 引用 指向 不 处 于 编辑 状 
态 的 其 他 已 经 打开 的 图 片 。 这 样 当 图 像 编辑 器 程序 的 内 存 不 足 时 ， 垃 
圾 回收 器 可 以 释放 不 处 于 编辑 状态 的 图 片 所 占 的 内 存 空 间 。 当 程序 中 
需要 引用 所 占 内 存 比 较 大 的 对 象 时 ， 可 以 考虑 使 用 软 引 用 来 指向 该 对 
象 。 

软 引用 的 特点 是 它 的 一 个 实例 保存 对 一 个 Java 对 象 的 软 引用 ， 该 软 
引用 的 存在 不 妨碍 垃圾 收集 线程 对 该 Java 对 象 的 回收 。 也 就 是 说 ， 一 旦 
软 引 用 保存 了 对 一 个 Java 对 象 的 软 引用 后 ， 在 垃圾 线程 对 这 个 Java 对 象 
回收 前 ， 软 引用 类 所 提供 的 get () 方法 返回 Java 对 象 的 强 引用 。 另 
外 ， 一 旦 垃圾 线程 回收 该 Java 对 象 之 后 ，get () 方法 将 返回 null。 


代码 清单 3-103 软 引用 实例 


import java.lang.ref.Reference; 


import java.lang.ref.ReferenceQueue; 


import java.lang.ref.SoftReference; 


public class MyObject { 


public static ReferenceQueue softQueue; 


GOverride 
protected void finalize() throws Throwable( 
super.finalize(); 
Reference«MyObject» obj = null; 
try{ 
obj = (Reference<MyObject>) softQueue. remove () ; 
}catch (InterruptedException e) { 
e.printStackTrace(); 
} 
System.out.println(obj); 
if (0bj!-null)( 
System.out.println("Object for SoftReference is"*obj.get()); 
} 
System.out.println("MyObject's finalize called");//RA4 cC 回收 时 才 会 输出 
} 
QOverride 
public String toString() { 
return "I am MyObject"; 


public static void main(String[] args) { 
MyObject obj = new MyObject();// 强 引用 
softQueue = new ReferenceQueue«MyObject» () ;// 创 建 引用 那个 队列 
SoftReference«MyObject» softRef = new SoftReference<MyObject>(obj,softQueue); // 创 
建 软 引用 
System.out.println(obj); 
obj=null; //THI& 5&5] A 
System.gc(); 
System.out.println(obj); 
System.out.println("After GC:Soft Get= "tsoftRef.get()); 
System.out.println("Z BG A3& ME"); 
byte[] b = new byte[1000*1024*925];//2 Bt —F"Yk & X WE IR, IRÉ GC 
System.out.println("After new byte[]:Soft Get= "+softRef.get()); 
System.out.println (obj); 


上 面 的 例子 中 ， 首 先 构 造 MyObject 对 象 ， 并 将 其 赋值 给 obj fe, 
构成 强 引 用 。 然 后 使 用 SoftReference 构 造 这 个 MyObject 对 象 的 软 引 用 
softRef， 并 注册 到 softQueue 引 用 队列 。 当 softRef 被 回收 时 ， 会 被 加 入 
softQueue 队列 。 设 置 obj=nul， 删 除 这 个 强 引 用 ， 因 此 系统 内 对 
MyObject 对 象 的 引用 只 剩 下 软 引 用 。 此 时 ， 显 示 调 用 GC， 通 过 软 引 用 
的 get () 方法 ， 取 得 MyObject 对 象 实例 的 强 引 用 ， 发 现 对 象 并 未 被 回 
收 。 这 说 明 GC 在 内 存 充 足 的 情况 下 不 会 回收 入 软 引 用 对 象 。 接 着 分 配 
一 块 大 的 堆 空 间 ， 把 应 用 最 大 内 存 设 置 为 IMB (Xmx1M) ， 这 样 会 使 
系统 堆 空 存 使 用 紧张 ， 从 而 产生 新 一 轮 GC。 在 这 次 GC 后 ，softRef.get 

() 不 再 返回 MyObject 对 象 ， 而 是 返回 null， 这 说 明 系 统 内 存 紧 张 下 
JVM 会 回收 软 引 用 。 软 引用 被 回收 时 ， 会 被 加 入 注册 的 引用 队列 。 

作为 一 个 Java 对 象 ， 软 引用 对 象 除 了 具有 保存 软 引 用 的 特殊 性 之 
外 ， 也 具有 Java 对 象 的 一 般 性 。 所 以 ， 当 软 引 用 对 象 被 回收 之 后 ， 虽 然 
这 个 软 引 用 对 象 的 get () 方法 返回 null， 但 这 个 对 象 已 经 不 再 具有 存在 
的 价值 ， 需 要 一 个 适当 的 清除 机 制 ， 避 免 大 量 软 引用 对 象 带 来 的 内 存 
泄漏 。 在 java.lang.ref 包 里 还 提供 了 ReferenceQueue。 如 果 在 创建 软 引 用 
对 象 的 时 候 ， 使 用 了 一 个 ReferenceQueue 对 象 作 为 参数 提供 给 软 引用 的 
构造 方法 ， 如 清单 3-104 所 示 。 


代码 清单 3-104 ReferenceQueue HR 


ReferenceQueue queue = new ReferenceQueue( 


. 
了 


SoftReference ref-new SoftReference(myObject, queue); 


那么 当 这 个 SoftReference 所 持 有 的 软 引 用 的 myObject 被 垃圾 收集 器 
回收 的 同时 ，ref 所 强 引 用 的 软 引 用 对 象 被 询 入 ReferenceQueue。 也 就 是 
说 ，ReferenceQueue 中 保存 的 对 象 是 Reference 对 象 ， 而 且 是 已 经 失去 了 
它 所 软 引 用 的 对 象 的 Reference 对 象 。 另 外 从 ReferenceQueue 这 个 名 字 也 
可 以 看 出 ， 它 是 一 个 队列 ， 当 我 们 调用 它 的 poll 0 方法 的 时 候 ， 如 果 
这 个 队列 中 不 是 空 队 列 ， 那 么 将 返回 队列 前 面 的 那个 Reference 对 象 。 

在 任何 时 候 ， 我 们 都 可 以 调用 ReferenceQueue 的 poll () 方法 来 检 
查 是 否 有 它 所 关心 的 非 强 可 及 对 象 被 回收 。 如 果 队 列 为 空 ， 将 返回 一 
个 null， 否 则 该 方法 返回 队列 中 前 面 的 一 个 Reference 对 象 。 利 用 这 个 方 
法 ， 我 们 可 以 检查 哪个 SoftReference 所 软 引 用 的 对 象 已 经 被 回收 。 于 是 


我 们 可 以 把 这 些 失 去 所 软 引 用 的 对 象 的 SoftReference 对 象 清除 掉 。 常 用 
的 方式 如 SoftReference ref=null; while ( (ref= (EmployeeRef) q.poll 
O ) ! =null) {// 清 除 ref}。 
下 面 代 码 中 的 FileEditor 类 用 来 对 多 个 文件 进行 编辑 。 出 于 性 能 

面 的 考虑 ，FileEditor 类 的 对 象 会 在 内 部 缓存 之 前 已 经 打开 过 的 文件 的 
数据 内 容 ， 以 方便 用 户 在 同时 打开 的 多 个 文件 之 间 进 行 快速 切换 。 同 
时 打开 的 文件 过 多 会 占用 比较 多 的 内 存 资 源 。 因 此 ， 表 示 文 件数 据 的 
FileData 类 使 用 软 引 用 来 指向 包含 文件 数据 的 byte[] 对 象 。 当 虚拟 机 的 内 
存 不 足 时 ， 这 些 byte[] 对 象 可 以 被 垃圾 回收 器 释放 。 这 里 需要 注意 
FileData 类 的 getData 方 法 的 实现 中 对 软 引 用 的 使 用 方式 。 通 过 get 方 法 获 
取 软 引用 所 指向 的 对 象 之 后 ， 需 要 判断 这 个 对 象 是 否 还 存活 。 如 果 get 
方法 的 返回 值 为 null， 那 么 说 明 对 该 对 象 的 引用 已 经 被 清空 ， 应 该 重新 
创建 出 相关 的 对 象 。 


代码 清单 3-105 文件 编辑 器 示例 


import java.io.IOException; 


import java.lang.ref.SoftReference; 
import java.nio.file.Files; 
import java.nio.file.Path; 
import java.nio.file.Paths; 


import java.util.HashMap; 


import java.util.Map; 


public class FileEditor ( 
private static class FileData{ 
private Path filePath; 
private SoftReference<byte[]> dataRef; 


public FileData(Path filePath)( 
this.filePath = filePath; 
this.dataRef = new SoftReference«byte[]» (new byte[0]); 


public Path getPath()í 
return filePath; 


public byte[] getData() throws IOException( 

byte[] dataArray = dataRef.get(); 

if(dataArray == null || dataArray.length == 0) { 
dataArray = readFile(); 
dataRef = new SoftReference<byte[]>(dataArray) ; 
dataArray = null; 

} 

return dataRef.get(); 


private byte[] readFile() throws IOException{ 
return Files.readAllBytes(filePath); 


private FileData currentFileData; 
private Map«Path,FileData» openedFiles = new HashMap<>(); 


public void switchTo(String filePath) { 
Path path = Paths.get(filePath).toAbsolutePath(); 
if (openedFiles.containsKey (path) ) { 
currentFileData = openedFiles.get (path); 
Jelset 
currentFileData - new FileData (path); 
openedFiles.put (path,currentFileData); 


public void useFile() throws IOException{ 
if(currentFileData !- null) { 
System.out.println(String.format("",currentFileData.getPath(), 
currentFileData.getData().length)); 
} 


} 


public static void main(String[] args) { 
FileEditor fe - new FileEditor(); 
try { 
for(int i=0;1<100;it+) { 
fe.switchTo ("i CHK") ; 
fe.useFile(); 
} 
} catch (IOException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


} 


使 用 FileEditor 类 的 对 象 依次 打开 某 个 目录 下 包含 的 大 小 各 异 的 多 
个 文件 ， 同 时 通过 虚拟 机 的 启动 参数 “-Xmx” 把 虚拟 机 所 用 的 堆 内 存 的 
最 大 值 设 置 为 一 个 相对 较 小 的 值 。 在 运行 时 会 发 现 ， 虽然 虚拟 机 可 用 
堆 内 存 的 最 大 值 远 小 于 所 处 理 的 所 有 文件 的 大 小 的 总 和 ， 但 是 程序 在 
运行 中 也 不 会 抛 出 OOM 错 误 。 这 是 因为 当 虚 拟 机 中 内 存 不 足 时 ， 软 引 
用 指向 的 byte[] 对 象 会 被 释放 ， 从 而 可 以 腾 出 内 存 空间 供 之 后 的 文件 操 
作 使 用 。 如 果 使 用 强 引 用 指向 byte[] 对 象 ， 在 打开 目录 下 的 部 分 文件 之 
后 ， 就 会 出 现 OOM 错 误 ， 这 是 因为 虚拟 机 的 堆 内 存 不 足以 容纳 全 部 文 
件 的 内 容 ， 而 垃圾 回收 器 又 无 法 释放 强 引 用 指向 的 byte[] 对 象 。 


3.4.3 弱 引 用 (Weak Reference) 


弱 引 用 表示 对 一 个 对 象 的 引用 ， 使 用 弱 引 用 后 ， 可 以 维持 对 
referent 的 引用 ， 而 不 会 阻止 它 被 垃圾 收集 。 当 垃圾 收集 器 跟踪 堆 的 时 
候 ， 如 果 对 一 个 对 象 的 引用 只 有 弱 引 用 ， 那 么 这 个 referent 就 会 成 为 垃 
圾 收集 的 候选 对 象 ， 就 像 没有 任何 剩余 的 引用 一 样 ， 而 且 所 有 剩余 的 
弱 引 用 都 被 清除 。 弱 引用 是 在 构造 时 设置 的 ， 在 没有 被 清除 之 前 ， 可 


以 获取 它 的 值 ， 如 果 弱 引用 被 清除 了 ， 无 论 是 被 垃圾 收集 了 ， 还 是 有 
人 调用 了 clear () 方法 ， 它 都 会 返回 null。 所 以 ,我 们 在 使 用 弱 引 用 对 
象 之 前 ， 都 需要 检查 是 否 返 回 一 个 非 null 值 。 

弱 引 用 是 一 种 比 软 引用 较 弱 的 引用 类 型 。 在 系统 GC 时 ， 只 要 发 现 
弱 引 用 ， 不 管 系统 堆 空 间 是 否 足 够 ， 都 会 将 对 象 进行 回收 。 但 是 ， 由 
于 垃圾 回收 器 的 线程 通常 优先 级 很 低 ， 因 此 并 不 一 定 能 很 快 地 发 现 持 
有 弱 引 用 的 对 象 。 在 这 种 情况 下 ， 弱 引用 对 象 可 以 存在 较 长 的 时 间 。 
一 旦 一 个 弱 引 用 对 象 被 垃圾 回收 器 回收 ， 便 会 加 入 到 一 个 注册 引用 队 
列 中 。 上 述 例 子 只 需要 更 改 对 象 类 型 为 weakReference 即 可 ， 会 看 到 一 
旦 obj 被 设置 为 null，GC 立 即 回收 若 类 型 实例 。 


WeakReference«MyObject» Ref = new WeakReference«MyObject» (obj, softQueue) ;// 创 建 
弱 引 用 


弱 引 用 、 软 引用 都 非常 适合 来 保存 那些 可 有 可 无 的 缓存 数据 。 如 
果 这 么 做 ， 当 系统 内 存 不 足 时 ， 这 些 缓存 数据 会 被 回收 ， 不 会 导致 内 
存 溢出 。 当 内 存 资源 充足 时 ， 这 些 缓存 数据 又 可 以 存在 相当 长 的 时 
间 ， 从 而 起 到 加 速 系统 的 作用 。 

用 一 个 普通 的 强 引 用 拷贝 一 个 对 象 引 用 时 ， 限 制 对 象 的 生命 周期 
至 少 与 被 拷贝 的 引用 的 生命 周期 一 样 长 。 如 果 我 们 将 一 个 对 象 放 入 一 
个 全 局 集合 中 的 话 ， 那 么 它 可 能 就 与 程序 的 生命 周期 一 样 。 另 一 方 
面 ， 在 创建 对 一 个 对 象 的 弱 引 用 时 ， 完 全 没有 扩展 对 象 的 生命 周期 ， 
只 是 在 对 象 仍然 存活 的 时 候 ， 保 持 另 一 种 到 达 它 的 方法 。 

弱 引 用 的 重要 作用 是 解决 对 象 的 存活 时 间 过 长 的 问题 。 在 程序 
中 ， 一 个 对 象 的 实际 存活 时 间 应 该 与 它 的 逻辑 存活 时 间 一 样 。 从 逻辑 
上 来 说 ， 一 个 对 象 应 该 在 某 个 方法 调用 完成 之 后 就 不 再 被 需要 了 ， 可 
以 对 其 进行 垃圾 回收 。 但 是 ， 如 果 仍 然 有 其 他 的 强 引 用 存在 ， 该 对 象 
的 实际 存活 时 间 会 长 于 逻辑 存活 时 间 ， 直 到 其 他 的 强 引 用 不 再 存在 。 
这 样 的 对 象 在 程序 中 过 多 出 现 会 导致 虚拟 机 的 内 存 占 用 上 升 ， 最 后 产 
生 OOM 铬 误 。 要 解决 这 样 的 问题 ， 需 要 小 心 注 意 管理 对 象 上 的 强 5 
用 。 当 不 再 需要 引用 一 个 对 象 时 ， 显 式 地 清除 这 些 强 引 用 。 不 过 这 会 
对 开发 人 员 提 出 更 高 的 要 求 。 更 好 的 方法 是 使 用 弱 引 用 替换 强 引 用 来 
引用 这 些 对 象 。 这 样 既 可 以 引用 对 象 ， 又 可 以 避免 强 引 用 带 来 的 问 


ilo 


比较 典型 的 例子 是 在 哈 希 表 中 使 用 弱 引 用 。 如 下 面 代码 所 示 ， 通 
过 BookKeeper 类 来 对 图 书 及 其 借阅 者 进行 管理 。 在 内 部 实现 中 使 用 了 
一 个 HashMap 类 的 对 象 来 保存 图 书 及 其 借阅 者 之 间 的 对 应 关系 。 由 于 
HashMap 类 的 对 象 上 具有 对 所 包含 的 键 和 值得 对 象 的 强 引 用 ， 这 会 使 
Book 类 和 User 类 对 象 的 存活 时 间 变 得 至 少 和 HashMap 类 的 对 象 本 身 一 
样 长 。 当 HashMap 类 的 对 象 本 身 还 存活 时 ， 其 中 所 包含 的 Book 类 和 
User 类 的 对 象 都 无 法 被 垃圾 回收 器 回收 。 


代码 清单 3-106 哈 布 表 中 使 用 弱 引 用 示例 
import java.util.Set; 
import org.apache.hadoop.hbase.security.User; 
public class BookKeeper { 
private Map<Book, Set<User>> books = new HashMap<>(); 
public void borrowBook (Book book,User user) { 
Set<User> users = null; 
if (books.containsKey (book) ) { 
users = books.get (book) ; 
Jelse( 
users = new HashSet<User>() ; 
books. put (book, users) ; 
} 
users.add(user) ; 
} 
public void returnBook (Book book,User user) { 
if (books. containsKey (book) ) { 
Set<User> users = books.get (book) ; 


users. remove (user); 


解决 这 个 问题 的 做 法 是 使 用 弱 引 用 来 指向 这 些 对 象 ， 而 不 是 使 用 
默认 的 强 引 用 。 因 为 这 样 使 用 Map 接 口 的 情况 很 多 ，Java 标 准 库 提 供 了 
java.util.WeakHashMap 类 来 满足 这 种 常见 的 需求 。WeakHashMap 类 使 用 
弱 引 用 来 指向 其 中 所 包含 的 键 ， 而 键 对 应 的 值 对 象 仍然 由 强 引 用 来 指 
向 。 使 用 弱 引 用 的 好 处 是 weakHashMap 类 的 对 象 本 身 对 其 中 包含 的 键 
的 弱 引 用 不 会 影响 键 对 象 的 垃圾 回收 。 当 键 对 象 不 存在 其 他 类 型 更 强 
的 引用 时 ， 键 对 象 会 被 从 WeakHashMap 类 的 对 象 中 删除 。 上 面 的 代码 
需要 把 books 对 应 的 Map 接 口 的 实现 类 换 成 WeakHashMap 类 既 可 。 不 过 
WeakHashMap 类 的 对 象 中 包含 的 值 对 象 仍 然 由 强 引用 来 指向 ， 因 此 不 
能 在 值 对 象 中 包含 键 对 象 的 引用 。 这 种 循环 引用 会 导致 对 象 无 法 被 垃 
圾 回收 器 回收 。 如 果 觉 得 对 于 值 对 象 使 用 强 引 用 不 合适 ， 可 以 在 添加 
到 WeakHashMap 类 的 对 象 之 前 用 一 个 WeakReference 类 的 对 象 来 包装 
Eo 

前 面 提 到 过 无 意识 对 象 保留 概念 ， 无 意识 对 象 保 留 最 常见 的 原因 
是 使 用 Map 将 元 数据 与 临时 对 象 (transient object) 相关 联 。 假 定 一 个 
对 象 具 有 中 等 生命 周期 ， 比 分 配 它 的 那个 方法 调用 的 生命 周期 长 ， 但 
是 比 应 用 程序 的 生命 周期 短 ， 如 客户 机 的 Socket 连 接 。 需 要 将 一 些 元 数 
据 与 这 个 Socket 关 联 ， 如 生成 连接 的 用 户 的 标识 。 在 创建 Socket 时 是 不 
知道 这 些 信 息 的 ， 并 且 不 能 将 数据 添加 到 Socket 对 象 上 ， 因 为 不 能 控制 
Socket 类 或 者 它 的 子 类 。 这 时 ， 典 型 的 方法 就 是 在 一 个 全 局 Map 中 存储 
这 些 信息 ， 如 代码 清单 3-107 中 的 SocketManager 类 所 示 。 


代码 清单 3-107 使 用 一 个 全 局 Map 将 元 数据 关联 到 一 个 对 象 
public class SocketManager { 
private Map<Socket,User> m = new HashMap<Socket, User»? (); 
public void setUser (Socket s, User u) { 
m.put(s, u); 
} 


public User getUser (Socket s) { 


return m.get (s) ; 
} 
public void removeUser (Socket s) { 
m. remove (s); 
} 
} 
SocketManager socketManager; 


socketManager.setUser (socket, user); 


这 种 方法 的 问题 是 元 数据 的 生命 周期 需要 与 套 接 字 的 生命 周期 挂 
钩 ， 但 是 除非 准确 地 知道 什么 时 候 程 序 不 再 需要 这 个 套 接 字 ， 并 记 住 
从 Map 中 删除 相应 的 映射 ， 否 则 ，Socket 和 User 对 象 将 会 永远 留 在 Map 
中 ， 远 远 超过 响应 了 请 求 和 关闭 Socket 的 时 间 。 这 会 阻止 Socket 和 User 
对 象 被 垃圾 收集 ， 即 使 应 用 程序 不 会 再 使 用 它们 。 这 些 对 象 留 下 来 不 
受 控制 ， 很 容易 造成 程序 在 长 时 间 运 行 后 内 存 爆满 。 除 了 最 简单 的 情 
况 ， 在 几乎 所 有 情况 下 找 出 什么 时 候 Socket 不 再 被 程序 使 用 是 一 件 很 烦 
人 和 容易 出 错 的 任务 ， 需 要 人 工 对 内 存 进 行 管理 。 

弱 引 用 对 于 构造 弱 集 合 最 有 用 ， 如 那些 在 应 用 程序 的 其 余部 分 使 
用 对 象 期 间 存 储 关 于 这 些 对 象 的 元 数据 的 集合 ， 这 就 是 SocketManager 
类 所 要 做 的 工作 。 因 为 这 是 弱 引 用 最 常见 的 用 法 ，WeakHashMap 对 键 

(而 不 是 对 值 ) 使 用 弱 引 用 。 如 果 在 一 个 普通 HashMap 中 用 一 个 对 象 
作为 键 ， 那 么 这 个 对 象 在 映射 从 Map 中 删除 之 前 不 能 被 回收 ， 
WeakHashMap 使 您 可 以 用 一 个 对 象 作 为 Map 键 ， 同 时 不 会 阻止 这 个 对 
象 被 垃圾 收集 。 代 码 清单 3-108 给 出 了 WeakHashMap 的 get () 方法 的 一 
种 可 能 实现 ， 它 展示 了 弱 引 用 的 使 用 方式 。 


代码 清单 3-108 WeakReference.get() 的 一 种 可 能 实现 
public class WeakHashMap<K,V> implements Map<K,V> { 
private static class Entry<K,V> extends WeakReference<K> 
implements Map.Entry<K,V> { 
private V value; 
private final int hash; 


private Entry<K,V> next; 


} 
public V get (Object key) { 
int hash = getHash (key) ; 
Entry<k,V> e = getChain (hash); 
while (e != null) { 
K eKey- e.get (); 
if (e.hash == hash && (key == eKey || key.equals (eKey))) 
return e.value; 
e - e.next; 
} 
return null; 


} 


i] FH WeakReference.get () 方法 时 ， 它 返回 一 个 对 对 象 的 强 引 用 
(如 果 它 仍然 存活 的 话 ) ， 因 此 不 需要 担心 映射 在 while 循 环 体 中 消 
失 ， 因 为 强 引 用 会 防止 它 被 垃圾 收集 。WeakHashMap 的 实现 展示 了 弱 
引用 的 一 种 常见 用 法 ， 一 些 内 部 对 象 扩展 WeakReference。 在 向 
WeakHashMap 中 添加 映射 时 ， 请 记 住 映射 可 能 会 在 以 后 “脱离 ”， 因 为 
键 被 垃圾 收集 了 。 在 这 种 情况 下 ，get () 返回 null， 这 使 得 测试 get 
() 的 返回 值 是 否 为 null 变 得 比 平 时 更 重要 了 。 
代码 清单 3-108 中 所 述 的 SocketManager 防 止 泄漏 很 容易 ， 只 要 用 
WeakHashMap 人 代替 HashMap 就 行 了 ， 如 代码 清单 3-109 所 示 。 
如 R SocketManager 需要 线程 安 人 全， 那么 可 以 用 
Collections.synchronizedMap () 包装 WeakHashMap。 当 映射 的 生命 周 


期 必须 与 键 的 生命 周期 联系 在 一 起 时 ， 可 以 使 用 这 种 方法 。 不 过 ， 应 
当 小 心 不 滥 用 这 种 搁 术 ， 大 多 数 时 候 还 是 应 当 使 用 普通 的 HashMap 作 
为 Map 的 实现 。 


代码 清单 3-109 用 WeakHashMap 修复 SocketManager 
public class SocketManager { 
private Map<Socket,User> m = new WeakHashMap<Socket, User? () ; 
public void setUser(Socket s, User u) { 
m.put(s, u); 
} 
public User getUser (Socket s) { 
return m.get (s); 
} 
} 


WeakHashMap 用 弱 引 用 承载 映射 键 ， 这 使 得 应 用 程序 不 再 使 用 键 
对 象 时 它们 可 以 被 垃圾 收集 ，get () 实现 可 以 根据 WeakReference.get 
() 是 否 返回 null 来 区 分 死 的 映射 和 活 的 映射 。 但 是 这 只 是 防止 Map 的 
内 存 消 耗 在 应 用 程序 的 生命 周期 中 不 断 增加 所 需要 做 的 工作 的 一 半 ， 
还 需要 做 一 些 工作 以 便 在 键 对 象 被 收集 后 从 Map 中 删除 死 项 。 否 则 ， 
Map 会 充满 对 应 于 被 回收 键 的 项 。 虽 然 这 对 于 应 用 程序 是 不 可 见 的 ， 但 
是 它 仍 然 会 造成 应 用 程序 耗 尽 内 存 ， 因 为 即便 键 被 收集 了 ，Map.Entry 
和 值 对 象 也 不 会 被 收集 。 我 们 可 以 通过 周期 性 地 扫 摘 Map， 对 每 一 个 弱 
引用 调用 get O ， 并 在 get () 返回 null 时 删除 那个 映射 而 消除 死 映 
射 。 但 是 如 果 Map 有 许多 活 的 项 ， 那 么 这 种 方法 的 效率 很 低 。 如 果 有 一 
种 方法 可 以 在 弱 引 用 的 对 象 被 垃圾 收集 时 发 出 通知 就 好 了 ， 这 就 是 引 
用 队列 的 作用 。 

引用 队列 是 垃圾 收集 器 向 应 用 程序 返回 关于 对 象 生 命 周 期 的 信息 
的 主要 方法 。 弱 引用 有 两 个 构造 遂 数 : 一 个 只 取 引 用 作为 参数 ， 另 一 
个 还 取 引 用 队列 作为 参数 。 如 果 用 关联 的 引用 队列 创建 弱 引 用 ， 在 对 
象 引 用 成 为 GC 候选 对 象 时 ， 这 个 引用 对 象 就 在 引用 清除 后 加 入 到 引用 
队列 中 。 之 后 ， 应 用 程序 从 引用 队列 提取 引用 并 了 解 到 它 的 引用 对 象 


已 经 被 收集 ， 因 此 可 以 进行 相应 的 清理 活动 ， 如 去 掉 已 不 在 弱 集 合 中 
的 对 象 的 项 。 

WeakHashMap 有 一 个 名 为 expungeStaleEntries () 的 私有 方法 ， 大 
多 数 Map 操 作 中 会 调用 它 ， 它 去 掉 引 用 队列 中 所 有 失效 的 引用 ， 并 删除 
关联 的 上 映射。 代码 清单 3-110 展 示 了 expungeStaleEntries () 的 一 种 可 能 
实现 。 用 于 存储 键 - 值 映射 的 Entry 类 型 扩展 了 WeakReference， 因 此 当 
expungeStaleEntries () 要 求 下 一 个 失效 的 弱 引 用 时 ， 它 得 到 一 个 
Entry。 用 引用 队列 代替 定期 扫描 内 容 的 方法 来 清理 Map 更 有 效 ， 因 为 
清理 过 程 不 会 触及 活 的 项 ， 只 有 在 有 实际 加 入 队列 的 引用 时 它 才 工 
作 。 


代码 清单 3-110 WeakHashMap.expungeStaleEntries() 的 可 能 实现 
private void expungeStaleEntries() | 
Entry«K,V» e; 
while ( (e = (Entry<K,V>) queue.poll()) != null) { 
int hash = e.hash; 
Entry<K,V> prev = getChain (hash); 
Entry«K,V» cur = prev; 
while (cur != null) { 
Entry<k,V> next = cur.next; 
if (cur == e) { 
if (prev == e) 
setChain (hash, next); 
else 
prev.next = next; 
break; 
} 
prev = cur; 


cur = next; 


我 们 再 通过 一 些 例 子 来 看 看 weakHashMap 类 的 使 用 。 
WeakHashMap 在 java.util 包 内 ， 它 实现 了 Map 接 口 ， 是 HashMap 的 一 种 
实现 ， 它 使 用 弱 引 用 作为 内 部 数据 的 存储 方案 。WeakHashMap 是 弱 引 
用 的 一 种 典型 应 用 ， 它 可 以 作为 简单 的 缓存 表 解 决 方案 。 

如 果 在 系统 中 需要 一 瀛 很 大 的 Map 表 ， Map 中 的 表 项 作为 缓存 之 

这 也 意味 着 即使 没有 能 从 该 Map 中 取得 相应 的 数据 ， 系 统 也 可 以 通 
MEAS REPE < 数据 。 虽 然 这 样 会 消耗 更 多 的 时 间 ， 但 是 不 影响 
系统 的 正常 运行 。 在 这 种 场景 下 ， ER On RE cd 的 。 
因为 WeakHashMap 会 在 系统 内 存 范 围 内 ， 保 存 所 有 表 项 ， 而 一 旦 内 存 
不 够 ,在 GC 时 没有 被 引用 的 表 项 也 会 很 快 被 清除 掉 ， 从 而 避免 系统 内 
T£ do 

代码 清单 3-111 所 示 的 两 段 代 码 分 别 用 WeakHashMap 和 HashMap 保 
存 大 量 的 数据 ，JVM 设 置 -Xmx1M 的 最 大 可 用 堆 。 


代码 清单 3-111 WeakHashMap 和 HashMap 对 比 实验 
public static void main(String[] args)| 

long start = System.currentTimeMillis(); 

Map map = new WeakHashMap() ; 

List list = new ArrayList(); 

for(int 1=0;1<100000;it+) { 
Integer ii = new Integer (i); 
map.put(ii, new byte[i]); 

} 


System.out.println(System.currentTimeMillis()-start); 


start = System.currentTimeMillis(); 
map - new HashMap(); 
list = new ArrayList (); 
for(int i=0;i<100000;i++){ 
Integer ii = new Integer (i); 
map.put (ii, new byte[i]); 
} 
System. out.println(System.currentTimeMillis()-start) ; 


} 
输出 结果 如 代码 清单 3-112 所 示 。 
代码 清单 3-112 输出 结果 
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Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 


at WeakHashMapVSHashMap ,main (WeakHashMapVSHashMap. java:24) 


由 此 可 见 ，WweakHashMap 会 在 系统 内 存 紧 张 时 使 用 弱 引 用 自动 释 
放 持 有 弱 引 用 的 内 存 数据 ， 而 HashMap 是 强 5 引 用 类 型 ， 会 抛 出 OOM。 
但 是 在 内 存 充 足 时 HashMap 的 速度 更 快 。 


上 述 代 码 中 只 要 加 一 句 代 码 就 会 让 WeakHashmap 抛 出 OOM 错 误 ， 
即 listadd (ii) ; o 

这 行 代码 对 key 进 行 了 强 引 用 ， 导 致 WeakHashMap 不 会 自动 启动 实 
例 回 收 机 制 。 因 此 ， 如 果 系 统 在 系统 中 通过 WeakHashMap 自动 清理 数 
据 ， 就 尽量 不 要 在 系统 的 其 他 地 方 强 引 用 WeakHashMap 的 key， 否 则 这 
些 key 就 不 会 被 回收 ，WeakHashMap 也 就 无 法 正常 释放 它们 所 占用 的 表 
项 。 

总 的 来 说 ， 弱 引用 对 象 与 软 引 用 对 象 的 最 大 不 同 就 在 于 ， 当 GC 在 
进行 回收 时 ， 需 要 通过 算法 检查 是 否 回 收 软 引 用 对 象 ， 而 对 于 弱 引 用 
对 象 ，GC 总 是 进行 回收 。 弱 引用 对 象 更 容易 、 更 快 被 GC 回 收 。 虽 然 ， 
GC 在 运行 时 一 定 回 收 Weak 对 象 ， 但 是 复杂 关系 的 弱 对 象 群 常常 需要 好 
几 次 GC 的 运行 才能 完成 。 就 像 上 面 描 述 的 场景 ， 弱 引用 对 象 常 常用 于 
Map 结 构 中 ， 引 用 数据 量 较 大 的 对 象 ， 一 旦 该 对 象 的 强 引 用 为 null 时 ， 
GC 能 够 快速 地 回收 该 对 象 空 间 。 

幽灵 引用 (Phantom Reference) 是 强度 最 弱 的 一 种 引用 类 型 ， 用 
java.lang.ref.PhantomReference RM. HA zi 5 | FH EE B Be TE— 
对 象 所 占 的 内 存 被 实际 回收 之 前 得 到 通知 ， 从 而 可 以 进行 一 些 相 关 的 
清理 工作 。 幽 灵 引 用 在 使 用 方式 上 与 之 前 介绍 的 两 种 引用 类 型 有 很 大 
的 不 同 : 首先 幽灵 引用 在 创建 时 必须 提供 一 个 引用 队列 作为 参数 ; 其 
次 幽灵 引用 对 象 的 get 方 法 总 是 返回 null， 因 此 无 法 通过 幽灵 引用 来 获取 
被 引用 的 对 象 。 

幽灵 引用 在 使 用 的 时 候 只 能 通过 引用 队列 来 操作 。 幽 灵 引 用 的 最 
大 优势 在 于 引用 对 象 被 添加 到 队列 中 的 时 机 。Java 语 言 提供 了 对 象 终止 

(finalization) 机 制 来 允许 开发 人 员 提 供 对 象 被 销毁 之 前 的 自 定义 处 理 
逻辑 。Object 类 提供 了 finalize 方 法 来 添加 自 定 义 的 销毁 逻辑 。 如 果 一 个 
类 有 特殊 的 销毁 逻辑 ， 可 以 履 写 finalize 方 法 。 从 功能 上 来 说 ，finalize 
方法 与 C++ 中 的 析 构 函数 比较 相似 ， 但 是 Java 求 用 的 是 基于 垃圾 回收 器 
的 自动 内 存 管理 机 制 ， 所 以 finalize 方 法 在 本 质 上 不 同 于 C++ 中 的 析 构 子 
数 。 当 垃圾 回收 器 发 现 没 有 引用 指向 一 个 对 象 时 ， 会 调用 这 个 对 象 的 
finalize 方 法 。 通 常 在 这 个 方法 中 进行 一 些 资源 释放 和 清理 的 工作 ， 比 
如 关闭 文件 、 套 接 字 和 数据 库 连 接 等 。 由 于 finalize 方 法 的 存在 ， 虚 拟 
机 中 的 对 象 一 般 处 于 三 种 可 能 的 状态 。 第 一 种 是 可 达 状 态 ， 当 有 引用 


指向 该 对 象 时 ， 该 对 象 处 于 可 达 状 态 。 根 据 引 用 类 型 的 不 同 ， 有 可 能 
Ere 软 引用 可 达 或 弱 引 用 可 达 状 态 。 第 二 种 是 可 复活 状 
态 ， 如 果 对 象 的 类 覆 写 了 finalize 方 法 ， 则 对 象 有 可 能 处 于 该 状态 。 虽 
然 垃 圾 回收 器 是 在 对 象 没有 引用 的 情况 下 才 调 用 其 finalize 方 法 ， 但 是 
在 finalize 方 法 的 实现 中 可 能 为 当前 对 象 添加 新 的 引用 。 因 此 在 finalize 
万 法 运行 完成 之 后 ， 垃 圾 回收 器 需要 重新 检查 该 对 象 的 引用 。 如 果 发 
现 新 的 引用 ， 那么 对 象 会 回 到 可 达 状 态 ， 相 当 于 该 对 象 被 复活 ; 否则 
对 象 会 变 成 不 可 达 状 态 。 当 对 象 从 可 复活 状态 变 为 可 达 状 态 之 后 ， 对 
家 会 再 次 出 现 ; pl TEX TP TEn Ta 
finalize 方 法 只 会 被 调用 一 次 。 up eH un 在 这 个 状态 下 
垃圾 回收 器 可 以 自由 地 释放 对 象 所 占用 的 内 存 空间 。 


3.4.4 引用 队列 


引用 队列 的 主要 作用 是 作为 一 个 通知 机 制 。 当 对 象 的 可 达 状 态 发 
生 改 变 时 ， 如 果 程 序 希望 得 到 通知 ， 可 以 使 用 引用 队列 。 当 从 引用 队 
列 中 获取 了 引用 对 象 之 后 ， 不 可 能 再 获取 所 指向 的 具体 对 象 。 对 于 软 
引用 和 弱 引 用 来 说 ， 在 被 放 入 队列 之 前 ， 它 们 的 引用 关系 就 已 经 被 清 
除了 ; 而 幽灵 引用 的 get 方 法 总 是 返回 null。 

WeakHashMap 类 的 实现 中 的 Entry 类 表示 哈 希 表 中 包含 的 条 目 。 
Entry 类 继承 自 WeakReference 类 ， 这 样 就 可 以 比较 方便 地 处 理 从 引用 队 
列 中 获取 的 引用 对 象 ， 因 为 引用 对 象 本 身 代 表 了 哈 希 表 中 的 条 目 。 
Entry 类 中 也 包含 了 与 条 目 相 关 的 基本 信息 ， 包 括 键 对 象 、 值 对 象 和 引 
用 队列 的 引用 等 。Entry 类 作为 一 个 弱 引 用 ， 指 向 的 是 条 目的 键 对 象 ， 
而 值 对 象 仍然 由 强 引 用 来 指向 。 在 程序 的 运行 过 程 中 ， WeakHashMap 
类 的 对 象 中 的 某 些 条 目的 键 对 象 可 能 变 成 了 弱 引 用 可 达 的 状态 。 垃 专 
回收 器 会 清除 这 些 弱 引用 并 将 其 放 入 WeakHashMap 类 的 对 象 的 引用 队 
列 中 。WeakHashmap 类 的 对 象 需要 在 合适 的 时 机 检查 这 个 队列 中 包含 
的 引用 对 象 。 由 于 引用 对 象 本 身 就 是 Entry 类 的 对 象 ， 因 此 可 以 直接 把 
引用 对 象 从 WeakHashMap 类 的 对 象 中 删除 。 


删除 引用 队列 中 的 条 目 是 通过 WeakHashMap 类 中 的 私有 方法 
expungeStaleEntries 来 完成 的 。 在 WeakHashMap 类 中 ， 大 部 分 涉及 条 目 


的 方法 的 实现 都 会 直接 或 间接 地 调用 expungeStaleEntries 方 法 来 处 理 
WeakHashMap 类 的 对 和 象 中 引用 队列 所 包含 的 条 目 。 这 也 是 
expungeStaleEntries 方 法 使 用 poll 来 检查 引用 队列 的 原因 。 由 于 对 
expungeStaleEntries 方 法 的 调用 会 比较 频繁 ， 会 对 WeakHashMap 类 中 的 
正常 操作 的 性 能 产生 影响 ， 因 此 使 用 非 阻塞 式 的 poll 方 法 是 个 更 好 的 选 
择 。 

鉴于 WeakHashMap 类 的 实现 机 制 ， 当 其 中 包含 的 条 目的 键 对 象 变 
成 弱 引 用 可 达 之 后 ， 在 下 一 次 对 WeakHashMap 类 的 对 象 进行 操作 时 ， 
这 些 键 对 象 对 应 的 条 目 才 会 被 删除 ， 所 以 必须 注意 这 种 情况 ， 如 果 对 
WeakHashMap 类 的 对 象 的 操作 比较 少 ， 那 么 使 用 weakHashMap 类 的 对 
象 也 会 出 现 某 些 键 对 象 的 存活 时 间 过 长 的 情况 。 


3.4.5 虚 引 用 (Phantom Reference) 


“ 虚 引用 ”顾名思义 ， 就 是 形同虚设 ， 与 其 他 几 种 引用 都 不 同 ， 虚 
引用 并 不 会 决定 对 象 的 生命 周期 ， 所 以 虚 引 用 又 被 称 为 “幽灵 引用 ”。 
如 果 一 个 对 象 仅 持 有 虚 引 用 ， 那 么 它 就 和 没有 任何 引用 一 样 ， 在 任何 
时 候 都 可 能 被 垃圾 回收 器 回收 。 虚 引用 的 主要 目的 是 在 一 个 对 象 所 占 
的 内 存 被 实际 回收 之 前 得 到 通知 ， 从 而 可 以 进行 一 些 相 关 的 清理 工 
作 。 虚 引用 在 使 用 方式 上 与 之 前 介绍 的 两 种 引用 类 型 有 很 大 的 不 同 : 
首先 虚 引 用 在 创建 时 必须 提供 一 个 引用 队列 作为 参数 ; 其 次 虚 引 用 对 
象 的 get 方 法 总 是 返回 NULL， 因 此 无 法 通过 虚 引 用 来 获取 被 引用 的 对 
象 。 

虚 引 用 主要 用 来 跟踪 对 象 被 垃圾 回收 器 回收 的 活动 。 虚 引用 与 软 
引用 和 弱 引 用 的 一 个 区 别 在 于 : 虚 引 用 必须 和 引用 队列 

(ReferenceQueue) 联合 使 用 。 当 垃圾 回收 器 准备 回收 一 个 对 象 时 ， 如 
果 发 现 它 还 有 虚 引 用 ， 就 会 在 回收 对 象 的 内 存 之 前 ， 把 这 个 虚 引 用 加 
入 到 与 之 关联 的 引用 队列 中 。 

前 面 介 绍 过 ， 软 引用 和 弱 引 用 在 其 可 达 状 态 达 到 时 就 可 能 被 添加 
到 对 应 的 引用 队列 中 。 也 就 是 说 ， 当 一 个 对 象 变 成 软 引 用 可 达 或 弱 引 
用 可 达 的 时 候 ， 指 向 这 个 对 象 的 引用 对 象 就 可 能 被 添加 到 引用 队列 
中 。 在 添加 到 队列 之 前 ， 垃 圾 回收 器 会 清除 掉 这 个 引用 对 象 的 引用 关 
系 。 当 软 引 用 和 弱 引 用 进入 队列 之 后 ， 对 象 的 finalize 方 法 可 能 还 没有 


被 调用 。 在 finalize 方 法 执行 之 后 ， 该 对 象 有 可 能 重新 回 到 可 达 状 态 。 
如 果 该 对 象 回 到 了 可 达 状 态 ， 而 指向 该 对 象 的 软 引 用 或 弱 引 用 对 象 的 
引用 关系 已 经 被 清除 ， 那 么 就 无 法 再 通过 引用 对 象 来 查找 这 个 对 象 。 
而 幽灵 引用 则 不 同 ， 只 有 在 对 象 的 finalize 方 法 被 运行 之 后 ， 幽 灵 引 用 
才 会 被 添加 到 队列 中 。 与 软 引 用 和 弱 引 用 不 同 的 是 ， 幽 灵 引 用 在 被 添 
加 到 队列 之 前 ， 垃 圾 回收 器 不 会 自动 清除 其 引用 关系 ， 需 要 调用 clear 
方法 来 显 式 地 清除 。 当 幽灵 引用 被 清除 之 后 ， 对 象 就 进入 了 不 可 达 状 
态 ， 垃 圾 回收 器 可 以 回收 其 内 存 。 当 幽灵 引用 被 添加 到 队列 之 后 ， 由 
于 PhantomReference 类 的 get 方 法 总 是 返回 null， 程 序 也 不 能 对 幽灵 引用 
所 指向 的 对 象 进行 任何 操作 。 这 就 避免 了 finalize 方 法 可 能 会 出 现 的 对 
象 复活 的 问题 。 幽 灵 引 用 是 作为 一 个 通知 机 制 而 存在 的 。 程 序 应 该 在 
得 到 通知 之 后 进行 与 当前 对 象 相关 的 清理 工作 。 

下 面 的 示例 给 出 了 幽灵 引用 对 象 的 使 用 方式 。 在 类 
ReferencedObject 中 履 写 finalize 方 法 来 提供 自 定 义 的 销毁 逻辑 。 这 里 只 
是 简单 地 在 控制 全 输出 提示 信息 。 在 使 用 幽灵 引用 队列 时 ， 通 过 队列 
的 poll 方 法 来 进行 轮 询 。 如 果 队 列 为 空 ， 就 通过 System.gc 方 法 来 建议 垃 
圾 回收 器 运行 。 运 行 示例 之 后 会 发 现 finalize 方 法 中 输出 的 消息 总 是 最 
早出 现 的 ， 这 说 明 当 幽灵 引用 进入 队列 之 后 ，finalize 方 法 已 经 被 运行 
过 了 。 如 果 改 用 软 引 用 或 弱 引 用 来 进行 相同 试验 ， 会 发 现 多 次 运行 的 
结果 并 不 一 致 ， 这 是 因为 软 引 用 和 弱 引 用 进入 队列 的 时 机 和 finalize 方 
法 的 调用 之 间 并 没有 必然 的 先后 关系 ， 如 代码 清单 3-113 所 示 。 


代码 清单 3-113 幽灵 引用 示例 
import java.lang.ref.PhantomReference; 


import java.lang.ref.Reference; 


import java.lang.ref.ReferenceQueue; 


public class UseReferenceQueue { 
private static class ReferencedObject { 
protected void finalize() throws Throwable{ 
System. out ,println ("finalize 方法 被 调用 ") ; 


super. finalize(); 


public void phantomReferenceQueue () { 


ReferenceQueue«ReferencedObject^ queue = new ReferenceQueue<> () ; 


ReferencedObject obj = new ReferencedObject () ; 


PhantomReference«ReferencedObject? phantomRef = new PhantomReference 


«ReferencedObject» (obj, queue) ; 


obj = null; 


Reference<? extends ReferencedObject> ref = null; 


while((ref = queue.poll()) == null) { 
System.gc () ; 
] 


phantomRef .clear(); 


System.out.println(ref == phantomRef);// 值 为 true 


System,out ,println(" 幽 灵 引 用 被 清除 。") ; 


} 
运行 程序 输出 如 代码 清单 3-114 所 示 。 


代码 清单 3-114 3-113 运行 输出 
finalize 方法 被 调用 
true 
oh 85] Alain 


如 果 硕 望 在 一 个 对 象 的 内 存 被 回收 之 前 进行 某 些 清理 工作 ， 那 么 
相对 于 使 用 finalize 方 法 来 说 ， 使 用 幽灵 引用 是 更 好 的 选择 。 幽 灵 引 用 
避免 了 finalize 方 法 可 能 造成 对 象 复活 的 问题 ， 减 少 了 开发 时 可 能 出 现 
的 错误 。 不 过 幽灵 引用 的 使 用 比 finalize 方 法 要 复杂 得 多 。 最 主要 的 问 
题 是 从 引用 队列 中 获取 幽灵 引用 之 后 ， 无 法 获取 其 指向 的 对 象 ， 也 就 
无 法 对 这 个 对 象 进行 操作 。 幽 灵 引 用 本 身 只 作为 一 个 通知 机 制 存 在 ， 
必须 存在 其 他 指向 此 对 象 的 引用 。 因 此 ， 相 对 于 使 用 幽灵 引用 ， 开 发 
人 员 更 倾向 于 着 慎 使 用 finalize 方 法 。 只 要 finalize 方 法 的 实现 避免 了 对 
象 复活 的 问题 ， 融 是 一 个 不 销 的 选择 。 

一 个 比较 实际 的 幽灵 引用 的 应 用 是 在 虚拟 机 内 存 总 量 受 限 的 情况 
下 ， 可 能 需要 等 待 一 个 占用 内 存 空间 较 大 的 对 象 被 回收 之 后 再 申请 新 
的 内 存 空间 。 通 过 这 种 方式 ， 可 以 把 程序 中 某 部 分 占用 的 内 存 控 制 在 
一 定 的 范围 之 内 。 下 面 的 示例 中 ， 类 PhantomAllocator 用 来 分 配 一 个 字 
节 数 组 供 调 用 者 使 用 。 当 每 次 分 配 新 的 字 节 数组 时 ， 会 先 确 保 之 前 分 
配 的 内 存 空间 被 成 功 释 放 。 在 每 次 分 配 新 的 字 世 数组 之 前 ， 引 用 队列 
的 remove 方 法 会 处 于 阻塞 状态 ， 直 到 有 新 的 引用 对 象 被 添加 到 队列 
中 。remove 方 法 返回 之 后 ， 之 前 的 字 节 数组 的 内 存 已 经 可 以 被 释放 ， 
通过 调用 System.gc 方 法 要 求 垃圾 回收 器 马上 回收 这 些 内 存 。 等 内 存 回 
收 之 后 再 创建 新 的 字 节 数组 ， 创 建 一 个 幽灵 引用 指向 新 的 字 节 数组 ， 
并 与 引用 队列 关联 起 来 。 


代码 清单 3-115 申请 新 的 内 存 空间 示例 
import java.lang.ref.PhantomReference; 
import java.lang.ref.Reference; 


import java.lang.ref.ReferenceQueue; 


public class PhantomAllocator { 
private byte[] data = null; 
private ReferenceQueue<byte[]> queue = new ReferenceQueue<byte[]>(); 
private Reference<? extends byte[]> ref = null; 
public byte[] get(int size) { 
if (ref == null) { 
data = new byte[size]; 


ref = new PhantomReference«byte[]» (data, queue) ; 


Jelse( 
data = null; 
System.gc() ; 
try{ 


ref = queue.remove () ; 

ref.clear(); 

ref = null; 

System.gc () ; 

data = new byte[size]; 

ref = new PhantomReference«byte[]» (data, queue) ; 
}catch (InterruptedException e) { 


e.printStackTrace(); 


} 


return data; 


在 上 面 的 代码 中 ， 通 过 “data=null” 来 清除 PhantomAllcator 类 对 象 本 
身 对 字 节 数组 的 强 引 用 。 在 进行 测试 的 时 候 ， 可 以 进行 多 次 字 节 数组 
分 配 操 作 ， 同 时 使 用 工具 来 观察 程序 所 占用 的 堆 内 存 的 情况 。 实 际 的 
运行 结果 是 ， 程 序 的 堆 内 存 的 占用 量 的 峰值 会 维持 在 一 个 相对 稳定 的 
值 。 

程序 可 以 通过 判断 引用 队列 中 是 否 已 经 加 入 了 虚 引 用 ， 来 了 解 被 
引用 的 对 象 是 否 将 要 被 垃圾 回收 。 如 果 程 序 发 现 某 个 虚 引 用 已 经 被 加 
入 到 引用 队列 ， 那 么 就 可 以 在 所 引用 的 对 象 的 内 存 被 回收 之 前 采取 必 
要 的 行动 。 

虚 引 用 时 所 有 引用 类 型 中 最 弱 的 一 个 。 一 个 持 有 虚 引 用 的 对 象 ， 
和 没有 引用 几乎 一 样 ， 随 时 都 可 能 被 垃圾 回收 器 回收 。 当 试图 通过 虚 
引用 的 get () 方法 取得 强 引 用 时 ， 总 是 会 失败 。 并 且 ， 虚 引用 必须 和 
引用 队列 一 起 使 用 ， 它 的 作用 在 于 跟踪 垃圾 回收 过 程 。 当 垃圾 回收 器 
准备 回收 一 个 对 象 时 ， 如 果 发 现 它 还 有 虚 引 用 ， 就 会 在 垃圾 回收 后 销 
毁 这 个 对 象 时 ， 将 这 个 虚 引 用 加 入 引用 队列 。 

调 入 该 句 人 代码，PhantomReference Ref=new PhantomReference < 
MyObject > (obj, softQueue) ; /创建 虚 引 用 ， 输 出 结果 显示 对 虚 引 
用 的 get () 操作 总 是 返回 null， 即 便 强 引用 还 存在 时 也 不 例外 。 

综 上 所 述 ， 虚 引用 最 大 的 作用 在 于 跟踪 对 象 回收 ， 清 理 被 销毁 对 
象 的 相关 资源 。 通 常 ， 当 对 象 不 被 使 用 时 ， 重 载 该 类 的 finalize () A 
法 可 以 回收 对 象 的 资产。 但 是 如 果 finalize () 方法 使 用 不 慎 ， 可 能 导 
致 该 对 象 复活 。 一 个 错误 的 finalize () 实现 可 能 导致 内 存 溢 出 ， 或 者 
对 象 永远 无 法 被 回收 ， 如 代码 清单 3-116 所 示 。 


代码 清单 3-116 虚 引用 错误 实现 
@Override 
protected void finalize() throws Throwable{ 
super. finalize(); 
MyObject obj = null; 
System. out.println("MyObject's finalize called");// 只 有 当 GC 回收 时 才 会 输出 
obj-this; 
System.out.println(obj); 


上 述 错 误 需 要 调用 两 次 obj=nul ， 去 除 该 对 象 的 强 引 用 。 由 于 
finalize () 只 会 被 调用 一 次 ， 因 此 ， 在 第 二 次 回收 时 ， 对 象 就 没有 机 
会 再 度 复活 了 。 
虚 引 用 在 使 用 的 时 候 只 能 通过 引用 队列 来 操作 。 虚 引用 的 最 大 优 
势 在 于 引用 对 象 被 添加 到 队列 中 的 时 机 。Java 语 言 提供 了 对 象 终止 
(finalization) 机 制 来 允许 开发 人 员 提 供 对 象 被 销毁 之 前 的 自 = 
逻辑 。Object 类 提供 了 finalize 方 法 来 添加 自 定 义 的 销毁 逻辑 。 如 果 一 
类 有 特殊 的 销毁 逻辑 ， 可 以 履 写 finalize 方 法 。 从 功能 上 来 说 ， ER 
方法 与 C++ 中 的 析 构 遂 数 比较 相似 ， 但 是 Java 采 用 的 是 基于 垃圾 回收 器 
的 自动 内 存 管理 机 制 ， 所 以 finalize 方 法 在 本 质 上 不 同 于 C++ 中 的 析 构 加 
数 。 当 垃圾 回收 器 发 现 没 有 引用 指向 一 个 对 象 时 ， 会 调用 这 个 对 象 的 
finalize 方 法 。 通 常 在 这 个 方法 中 进行 一 些 资 源 释放 和 清理 的 工作 ， 上 比 
如 关闭 文件 、 套 接 字 和 数据 库 连 接 等 。 由 于 finalize 方 法 的 存在 ， 虚 拟 
机 中 的 对 象 一 般 处 于 三 种 可 能 的 状态 。 第 一 种 是 可 达 状 态 ， 当 有 引用 
指向 该 对 象 时 ， 该 对 象 处 于 可 达 状 态 。 根 据 引 用 类 型 的 不 同 ， 有 可 能 
pM 软 引用 可 达 或 弱 引 用 可 达 状 态 。 第 二 种 是 可 复活 状 
态 ， 如 果 对 象 的 类 覆 写 了 finalize 方 法 ， 则 对 象 有 可 能 处 于 该 状态 。 虽 
然 垃圾 回收 器 是 在 对 象 没有 引用 的 情况 下 才 调 用 其 finalize 方 法 ， 但 是 
在 finalize 方 法 的 实现 中 可 能 为 当前 对 象 添加 新 的 引用 。 因 此 在 finalize 
万 法 运行 完成 之 后 ， 垃 圾 回收 器 需要 重新 检查 该 对 象 的 引用 。 如 果 发 
现 新 的 引用 ， 那 么 对 象 会 回 到 可 达 状 态 ， 相 当 于 该 对 象 被 复活 ; 否则 
对 象 会 变 成 不 可 达 状 态 。 当 对 象 从 可 复活 状态 变 为 可 达 状 态 之 后 ， 对 


象 会 再 次 出 现 没 有 引用 存在 的 情况 。 在 这 个 情况 下 ，finalize 方 法 不 会 
被 再 次 调用 ， 对 象 会 直接 变 成 不 可 达 状 态 ， 也 就 是 说 ， 一 个 对 象 的 
finalize 方 法 只 会 被 调用 一 次 。 第 三 种 是 不 可 达 状 态 ， 在 这 个 状态 下 ， 
垃圾 回收 器 可 以 自由 地 释放 对 象 所 占用 的 内 存 空间 。 

虚 引 用 的 用 途 较 少 ， 主 要 用 于 辅助 finalize 了 因数 的 使 用 。 虚 对 象 指 
一 些 对 象 ， 它 们 执行 完了 finalize 隐 数 ， 并 为 不 可 达 对 象 ， 但 是 它们 还 
没有 被 GC 回收 。 这 种 对 象 可 以 辅助 finalize 进 行 一 些 后 期 的 回收 工作 ， 
我 们 通过 覆盖 引用 的 clear () 方法 ， 增 强 资源 回收 机 制 的 灵活 性 。 总 
的 来 说 ， 虚 引用 可 以 用 来 做 一 些 精 细 的 内 存 控制 操作 。 虚 引用 是 专门 
针对 引用 队列 的 一 种 引用 申明 ， 例 如 你 声明 虚 引 用 的 时 候 是 要 传 入 一 
个 队列 ， 当 你 的 虚 引 用 所 引用 的 对 象 已 经 执行 完 finalize 浆 数 的 时 候 ， 
就 会 把 对 象 加 到 队列 里 面 ， 你 可 以 通过 判断 队列 里 面 是 不 是 有 对 象 来 
判断 你 的 对 象 是 不 是 要 被 回收 了 。 

综合 上 面 所 有 引用 类 型 的 描述 ， 根 据 GC 的 工作 原理 ， 我 们 可 以 通 
过 一 些 技巧 和 方式 ， 让 GC 运行 更 加 有 效率 ， 更 加 符合 应 用 程序 的 要 
求 。 以 下 就 是 一 些 程序 设计 的 几 点 建议 。 

(1) 最 基本 的 建议 就 是 尽早 释放 无 用 对 象 的 引用 。 大 多 数 程序 员 
在 使 用 临时 变量 的 时 候 ， 都 是 让 引用 变量 在 退出 活动 域 (scope) A, 
自动 设置 为 null。 我 们 在 使 用 这 种 方式 时 候 ， 必 须 特别 注意 一 些 复杂 的 
对 象 图 ， 例 如 数组 ， 队 列 ， 树 ， 图 等 ， 这 些 对 象 之 间 有 相互 引用 关系 
较为 复杂 。 对 于 这 类 对 象 ，GC 回 收 它 们 一 般 效率 较 低 。 如 果 程 序 允 
许 ， 尽 早 将 不 用 的 引用 对 象 赋 为 null。 这 样 可 以 加 速 GC 的 工作 。 

(2) 尽量 少 用 finalize 函 数 。finalize 国 数 是 Java 提 供给 程序 员 一 个 
释放 对 象 或 资源 的 机 会 。 但 是 ， 它 会 加 大 GC 的 工作 量 ， 因 此 尽量 少 采 
用 finalize 方 式 回 收 资源 。 

(3) 如 果 需 要 使 用 经 常 使 用 的 图 片 ， 可 以 使 用 soft 应 用 类 型 。 它 
可 以 尽 可 能 将 图 片 保 存在 内 存 中 ， 供 程序 调用 ， 而 不 引起 
OutOfMemoryo 

(4) 注意 集合 数据 类 型 ， 包 括 数组 、 树 、 图 、 链 表 等 数据 结构 ， 
这 些 数据 结构 对 GC 来 说 ， 回 收 更 为 复杂 。 另 外 ， 注 意 一 些 全 局 的 变 
量 ， 以 及 一 些 静态 变量 。 这 些 变 量 往往 容易 引起 悬挂 对 象 (dangling 
reference) ， 造 成 内 存 浪 费 。 


(5) 当 程 序 有 一 定 的 等 待 时 间 ， 程 序 员 可 以 手动 执行 System.gc 
() ， 通 知 GC 运 行 ， 但 是 Java 语 言 规范 并 不 保证 GC 一 定 会 执行 。 使 用 
增 量 式 GC 可 以 缩短 Java 程 序 的 暂停 时 间 。 


3.5 其 他 相关 概念 


3.5.1 JNI 技 术 提升 


JavaCPP 是 一 个 开源 库 ， 它 提供 了 在 Java 中 高 效 访问 本 地 C++ 的 方 
法 。 采 用 JNI 技 术 实 现 ， 所 以 支持 所 有 Java 实 现 包 括 Android[9] 系 统 ， 
Avian[10] 和 RoboVM[11]。 

总 的 来 说 ，JavaCPP 提 供 了 一 系列 的 Annotation 将 Java 代 码 映射 到 
C++ 代码 ， 并 使 用 一 个 可 执行 的 JAR 包 将 C++ 代码 转化 为 可 以 从 JVM 内 
调用 的 动态 链接 库 文件 。 

与 其 他 技术 相 比 ， 比 较 特 性 总 结 如 表 3-1 所 示 。 

表 3-1 类 似 技 术 介绍 或 特点 


Tel 和 了 Python 语言 创建 接口 
所 有 用 于 SWT 的 C 代码 都 是 通过 它 来 创建 的 
用 于 生成 针对 CH 的 JavaJNI 包 、HTML 文档 、 用 户 手册 
商业 版 本 ， 可 以 帮助 实现 Java 和 本 地 代码 之 间 的 无 颖 结合 
微软 发 布 的 一 个 工具 
针对 C 语言 的 一 个 工具 ， 帮 助 生成 JNI 代码 
INT 代码 生成 器 
针对 Python 的 接口 代码 生成 器 
JNA JNA (Java Native Access ) 提供 一 组 Java 工具 类 用 于 在 运行 期 动态 访问 系 


统 本 地 库 (native library: 如 Window 的 dll) 而 不 需要 编写 任何 Native/JNI 
代码 ,开发 人 员 只 要 在 一 个 java 接 口中 描述 目标 native library 的 函数 与 结构 ， 
INA 将 自动 实现 Java 接口 到 mative function 的 映射 

Windows 版 本 的 库 (DLL), #207 INI 代码 生成 

针对 haskell 模型 的 代码 生成 器 ， 主 要 生成 C 语言 

JavaCPP 更 加 自然 高 效 , 它 支 持 大 部 分 的 C++ 语法 特性 ,目前 已 经 能 成 功 封装 OpenCV， 


FFmpeg, libdcl394, PGR  FlyCapture, OpenKinect, videolnput, and 
ARToolKitPlus。 除 此 之 外 ， 它 还 能 直接 把 C/C++ 的 头 文件 转化 成 Java X, 
能 自动 生成 INI 代码 ， 编 译 成 本 地 库 ， 开 发 人 员 无 须 编写 烦琐 的 CH, INI 
代码 ， 从 而 提高 开发 效率 


为 了 调用 本 地 方法 ，JavaCPP 生 成 了 对 应 的 JNI 代 码 ， 并 且 把 这 些 
代码 输入 到 C++ 编译 器 ， 用 来 构建 本 地 库 。 使 用 了 Annotations 特 性 的 
Java 代 码 在 运行 时 会 自动 调用 Loaderload () 方法 从 Java 资 源 里 载 入 本 
地 库 ， 这 里 指 的 资源 是 工程 构建 过 程 中 配置 好 的 。 

我 们 先 来 演示 一 个 例子 ， 这 是 一 个 简单 的 注入 / 读 出 方法 ， 类 似 于 
JavaBean 的 工作 方式 。 代 码 3-117 所 示 的 LegacyLibrary.h 包 含 了 C++ 类 。 


代码 清单 3-117 LegacyLibrary.h 
#include <string> 
namespace LegacyLibrary { 
class LegacyClass { 
public: 
const std::string& get property() { return property; } 
void set property(const std::string& property) { this->property = 
property; ) 
std::string property; 


} 


接 下 来 定义 一 个 Java 类 ， 驱 动 JavaCPP 来 完成 调用 C++ 代码 ， 如 代 
码 清单 3-118 所 示 。 


代码 清单 3-118 LegacyLibraryjava 

import org.bytedeco. javacpp.*; 

import org.bytedeco.javacpp.annotation.*; 

@Platform(include="LegacyLibrary.h") 

(Namespace ("LegacyLibrary") 

public class LegacyLibrary { 

public static class LegacyClass extends Pointer { 

static { Loader.load(); } 
public LegacyClass() { allocate(); } 


private native void allocate(); 


// to call the getter and setter functions 
public native @StdString String get property(); public native void 
set property(String property); 


// to access the member variable directly 
public native @StdString String  property();public native void 
property (String property); 
| 


public static void main(String[] args) | 

// Pointer objects allocated in Java get deallocated once they become 
unreachable, 

// but C++ destructors can still be called in a timely fashion with 
Pointer.deallocate () 

LegacyClass l = new LegacyClass(); 

l.set property("Hello World!"); 

System,out .println(l.property()) ; 


以 上 两 个 类 放 在 一 个 目录 下 面 ， 接 下 来 运行 一 系列 编译 指令 ， 如 


代码 清单 3-119 所 示 。 


代码 清单 3-119 


\ 一 


15 


人 二 人 人 
{Tay 


$ javac -cp javacpp.jar LegacyLibrary.java 


$ java -jar javacpp.jar LegacyLibrary 


$ java -cp javacpp.jar LegacyLibrary 
Hello World! 


我 们 看 到 代码 清单 3-119 最 后 以 行 输出 了 一 行 “Hello World! ”， 这 
是 LegacyLibrary 类 里 面 定义 好 的 ， 通 过 一 个 setter 方 法 注入 字符 串 ， 
getter 方 法 读 出 字符 串 。 

我 们 可 以 看 到 文件 夹 里 面 内 容 的 变化 ， 刚 开始 的 时 候 只 有 .h、.java 
两 个 文件 ， 代 码 清单 3-119 所 示 的 3 个 命令 运行 过 后 ， 生 成 了 class 文 件 及 
本 地 方法 (native method) 对 应 的 .so 文件 ， 如 代码 清单 3-120 所 示 。 


代码 清单 3-120 文件 来 内 容 变化 


/home/zhoumingyao/javacpp-1.0-bin/javacpp-bin 


[root@nodel:2 javacpp-bin]# ls -lrt 


RAT 348 


a a 


EW-P--p-- j 


aiii] 


Orit 


| 


-rw-r--r-- 1 


Él-E--E-- 


STW | 


drwxr-xr-x 


2 


root 
root 
root 
root 
root 
root 
root 
root 


root 


root 
root 
root 
root 
root 
root 
root 
root 


root 


30984 7 月 
21986 7 月 
31955 7 月 
243318 7 月 
285 8 月 
1026 8 月 
643 8 月 
794 8 月 
4096 8 月 


11 00:59 LICENSE.txt 

11 08:52 README.md 

11 08:53 CHANGELOG.md 

11 12:20 javacpp.jar 

11 16:07 LegacyLibrary.h 

11 16:13 LegacyLibrary.java 

11 16:13 LegacyLibrary$LegacyClass.class 
11 16:13 LegacyLibrary.class 

11 16:13 linux-x86 64 


[root@nodel:2 javacpp-bin]f ls -lrt linux-x86 64 


总 用 量 36 


-rwxr-xr-x 1 root root 35784 8 月 11 16:13 libjniLegacyLibrary.so 


为 了 方便 用 户 使 用 JavaCPP， 该 项 目下 属 有 一 个 presets 项 目 ， 它 将 
一 些 常 用 的 项 目 ， 例 如 OpenCV、EFFMpeg 等 ， 都 编译 好 了 让 用 户 通过 
调用 Jar 包 的 方式 直接 使 用 。 当 然 ， 它 也 允许 用 户 通过 简便 的 方式 上 传 
自己 做 的 本 地 库 文件 ， 通 过 将 jar 包 上 传 到 Maven 仓 库 的 方式 共享 给 其 他 
用 户 。 

如 果 我 们 想 要 使 用 JavaCPP-presents， 我 们 需要 下 载 presets 源 代码 
或 者 已 经 编译 好 的 jar 文 件 。JavaCPP Presets 模 型 包括 了 很 多 广泛 被 使 用 
到 的 C/C++ 类 库 的 Java 配 置 和 接口 类 。 编 译 器 结合 C/C++ 的 头 文 件 ， 使 
用 org.bytedeco.javacpp.presets 包 里 面 的 配置 文件 来 创建 Java 接 口 文 件 ， 
这 样 就 可 以 产生 类 似 于 JNI 的 库 ，Java 程 序 可 以 调用 底层 的 C/C++ 库 。 
它 的 机 制 较为 方便 ， 可 以 被 用 在 Java 平 台 、Android 平 台 。 

现在 我 们 开始 尝试 针对 JavaCpp 的 测试 。 

我 们 这 个 实验 基于 一 个 人 脸 算法 库 ， 该 人 脸 算 法 库 具 备 检测 、 建 
模 、 比 对 功能 ， 网 上 有 很 多 开源 的 人 脸 识 别 算法 库 ， 大 家 可 以 自行 下 
载 。 当 我 们 使 用 单线 程 时 ， 本 地 预先 加 载 人 脸 特 征 值 数据 ， 分 别 使 用 
C++ 代码 和 Java 调 用 JNI 库 的 方式 ， 在 内 存 中 循环 比 对 1000 万 次 ， 比 对 
测试 结果 如 表 3-2 所 示 。 

表 3-2 JNI 库 和 C++ 库 单 线程 性 能 比较 


比 对 次 数 (万 次 ) | 耗 时 /ms 比 对 速率 /rps (records per second) 


C++ 11055 904322 


Java 调 用 JNI 库 — |00 —— (wm |m 
Javacpp 调用 算法 库 1000 13066 765345 


从 上 面 的 数据 可 以 看 出 ， 直 接 用 C++ 调用 算法 库 效 率 最 高 ， 其 次 是 
JavaCPP 方 式 ，JNI 方 式 耗 时 最 长 。 当 然 ， 这 里 没有 列举 的 JNA 技 术 ， 它 
的 效率 会 更 差 。 这 些 效率 差距 主要 在 底层 字 节 码 的 编译 形式 上 的 区 
Allo 

表 3-2 的 方式 是 单线 程 方式 ， 我 们 采用 多 线程 方式 再 来 做 一 次 测 
试 ， 测 试 结 果 如 表 3-3 所 示 。 我 们 可 以 看 出 ， 多 线程 环境 下 ，C++ 和 
JavaCPP 的 优势 更 加 明显 ， 整 体 效 率 系 统 接近 0.95 人 1，JNT 方 式 的 效率 
则 平均 在 0.81 左 右 。 


表 3-3 JNI 库 和 C++ 库 多 线程 性 能 比较 


比 对 次 数 | 总 耗 时 | 总 比 对 速率 /rps gm 
(万 次 ) F^ (records Run 率 /rps | 百分比 | 效率 系数 
CH Gp |sw gw lo || o | 
947] | 528w 1000 | 
som eim — — m Dm D — 
mom d ss81 bw 3W tooo 
as | — [ie jew lw ll | 
so [90  |ysD | ow w diwi 
m m e a D D 
IN S 7907 
[o m um ev. sw wm uno 
S00 | 14846 084 
hm mem — om [ao — 
[0 (so — 999 [saw — — — (SSW ll (os 
JavaCPP 
ik [o [soo feo [sow jiaw — 10m jin 
as [80 (i20 [sow Jaw | 1500 jos — | 
wo [59 |850 [ow |5sw [o [os | 


3.5.2 异常 捕获 机 制 


异常 处 理 以 一 种 简洁 的 方式 表示 了 程序 中 可 能 出 现 的 错误 ， 以 及 
应 对 这 些 错 误 的 处 理 方式 。 适 当地 使 用 异常 处 理 拷 术 ， 可 以 提高 代码 
的 可 靠 性 、 可 维护 性 和 可 读 性 。 但 是 如 果 使 用 不 当 ， 就 会 产生 相反 的 


效果 。 比 如 虽然 一 个 方法 声明 了 会 抛 出 某 个 异常 ， 但 是 使 用 这 个 方法 
的 代码 在 异常 发 生 的 时 候 ， 却 只 能 捕获 异常 之 后 就 直接 忽略 它 ， 无 法 
做 其 他 的 处 理 。 而 为 了 能 够 通过 编译 ， 又 不 得 不 加 上 catch 语 句 。 这 势 
必 会 造成 见 余 无 用 的 代码 ， 同 时 给 出 不 适当 的 异常 设计 的 一 个 信号 。 

Java 7 对 异常 处 理 做 了 两 个 重要 的 改动 : 一 个 是 支持 在 一 个 catch 子 
句 中 同时 捕获 多 个 异常 ， 另 外 一 个 是 在 捕获 并 重新 抛 出 异常 时 的 异常 
类 型 更 加 精确 。 

Java 语 言 中 基本 的 异常 处 理 是 围绕 try-catch-finally、throws 和 throw 
这 几 个 关键 词 展 开 的 。 具 体 来 说 ，throws 用 来 声明 一 个 方法 可 能 抛 出 的 
异常 ， 对 方法 体 中 可 能 抛 出 的 异常 都 要 进行 声明 ;throw 用 来 在 遇 到 错 
误 的 时 候 抛 出 一 个 具体 的 异常 ; try-catch-finally 则 用 来 捕获 异常 并 进行 
处 理 。Java 中 的 异常 有 受 检 异常 和 非 受 检 异 常 两 类 。 

1. 受 检 异 常 和 非 受 检 异 常 

在 异常 处 理 的 时 候 ， 都 会 接触 到 受 检 异 常 (checked exception) 和 
非 受 检 异 常 (unchecked exception) 这 两 种 异常 类 型 。 非 受 检 异 常 指 的 
是 java.lang.RuntimeException 和 java.lang.Error 类 及 其 子 类 ， 所 以 其 他 的 
异常 类 都 称 为 受 检 异 常 。 两 种 类 型 的 异常 在 作用 上 并 没有 差别 ， 唯 一 
的 差别 就 在 于 使 用 受 检 异常 时 的 合法 性 要 在 编译 时 刻 由 编译 器 来 检 
查 。 正 因为 如 此 ， 受 检 异 常 在 使 用 的 时 候 需 要 比 非 受 检 异常 更 多 的 代 
码 来 避免 编译 错误 。 

受 检 异 常 的 特点 在 于 它 强 制 要 求 开 发 人 员 在 代码 中 进行 显 式 的 声 
明和 捕获 ， 否 则 就 会 产生 编译 错误 。 这 种 限制 从 好 的 方面 来 说 ， 可 以 
防止 开发 人 员 意 外 地 忽略 某 些 出 错 的 情况 ， 因 为 编译 器 不 允许 出 现 未 
被 处 理 的 受 检 异 常 ， 从 不 好 的 方面 来 说 ， 受 检 异 常 对 程序 中 的 设计 提 
出 了 更 高 的 要 求 。 不 恰当 地 使 用 受 检 异常 ， 会 使 代码 中 充斥 着 大 量 没 
有 实际 作用 、 只 是 为 了 通过 编译 而 添加 的 代码 。 而 非 受 检 异常 的 特点 
是 ， 如 果 不 捕获 异常 ， 不 会 产生 编译 错误 ， 异 常会 在 运行 时 刻 才 被 抛 
出 。 非 受 检 异 常 的 好 处 是 可 以 去 掉 一 些 不 需要 的 异常 处 理 代码 ， 而 不 
好 之 处 是 开发 人 员 可 能 忽略 某 些 应 该 处 理 的 异常 。 一 个 典型 的 例子 是 
把 字符 串 转 换 成 数字 时 会 发 生 java.lang.NumberFormatException 异 常 ， 
忽略 该 异常 可 能 导致 一 个 错误 的 输入 就 造成 整个 程序 退出 。 

目前 的 主流 意见 是 最 好 优先 使 用 非 受 检 异 常 。 


2. 异 常 声 明 是 API 的 一 部 分 

这 一 条 提示 主要 是 针对 受 检 异常 的 。 在 一 个 公开 方法 的 声明 中 使 
用 throws 关 键 词 来 声明 其 可 能 抛 出 的 异常 的 时 候 ， 这 些 异 常 就 成 为 这 个 
公开 方法 的 一 部 分 ， 属 于 开放 API。 在 维护 这 个 公开 API 的 时 候 ， 这 些 
异常 有 可 能 会 对 API 的 演化 造成 障碍 ， 使 得 编写 代码 时 不 得 不 考虑 向 后 
兼容 性 的 问题 。 

如 果 公 开 方 法 声明 了 会 抛 出 一 个 受 检 异常 ， 那 么 这 个 API 的 使 用 者 
肯定 已 经 使 用 了 try-catch-finally 来 处 理 这 个 异常 。 如 果 在 后 面 的 版 本 更 
新 中 ， 发 现 该 API 抛 出 这 个 异常 是 不 合适 的 ， 也 不 能 直接 把 这 个 异常 的 
声明 删除 。 因 为 这 样 会 造成 之 前 的 API 使 用 者 的 代码 无 法 通过 编译 。 

因此 ， 对 于 API 的 设计 者 来 说 ， 并 慎 考 虑 每 个 公开 方法 所 声明 的 异 
常 是 很 有 必要 的 。 因 为 一 旦 加 了 异常 声明 ， 在 很 长 的 一 段 时 间 内 都 无 
法 甩 开 它 。 这 也 是 为 什么 推荐 使 用 非 受 检 异 常 的 一 个 重要 原因 ， 非 受 
检 异 常 不 需要 声明 就 可 以 直接 抛 出 。 但 是 对 于 一 个 方法 会 抛 出 的 非 受 
多 异常 ， 也 需要 在 文档 中 进行 说 明 。 

1. 精 心 设计 异常 的 层次 结构 

一 般 来 说 ， 一 个 程序 中 应 该 要 有 自己 的 异常 类 的 层次 结构 。 如 果 
只 打算 使 用 非 受 检 异 常 ， 至 少 需 要 一 个 继承 自 RuntimeException 的 异常 
类 。 如 果 还 需要 使 用 受 检 异 常 ， 还 要 有 另外 一 个 继承 自 Exception 的 异 
常 类 。 如 果 程序 中 可 能 出 现 的 异常 情况 比较 多 ， 应 该 在 不 同 的 抽象 层 
次 上 定义 相关 的 异常 ， 并 形成 一 个 完整 的 层次 结构 。 这 个 异常 的 层次 
结构 与 程序 本 身 的 类 层次 结构 是 相对 应 的 。 不 同 抽象 层次 上 的 代码 应 
该 只 声明 抛 出 同一 层次 的 相关 异常 。 

比如 一 个 典型 的 web 应 用 按照 自 顶 向 下 的 顺序 一 般 分 成 展现 层 、 服 
务 层 和 数据 访问 层 。 与 之 对 应 的 异常 也 应 该 按照 这 个 层次 结构 来 进行 
划分 。 数 据 访问 层 的 代码 应 该 只 声明 抛 出 与 访问 数据 相关 的 异常 ， 如 
数据 库 连接 和 操作 相关 的 异常 。 这 么 做 的 好 处 是 工作 于 某 个 抽象 层次 
上 的 开发 人 员 不 需要 去 了 解 其 他 层次 上 的 细节 。 比 如 服务 层 开发 人 员 
会 调用 数据 抽象 层 的 代码 ， 他 只 需要 关心 数据 访问 可 能 出 现 异 常 即 
可 ， 而 并 不 需要 去 关心 这 是 一 个 数据 库 访问 异常 ， 还 是 一 个 文件 系统 
访问 异常 。 这 种 抽象 层次 的 划分 对 系统 的 演化 是 比较 重要 的 。 假 如 系 


统 以 后 不 再 使 用 数据 库 作 为 数据 访问 的 实现 ， 服 务 层 的 异常 处 理 逻 辑 
也 不 会 受到 影响 。 

一 般 来 说 ， 对 于 程序 中 可 能 出 现 的 各 种 错误 ， 都 需要 声明 一 个 异 
常 类 与 之 对 应 。 有 些 开发 人 员 会 选择 一 个 大 而 全 的 异常 类 来 表示 各 种 
不 同类 型 的 错误 ， 利 用 这 个 异常 的 消息 来 区 分 不 同 的 错误 。 比 如 声明 
一 个 异常 类 BaseException， 不 管 是 数据 访问 错误 还 是 用 户 输 入 的 数据 
格式 不 对 ， 都 会 抛 出 同一 个 异常 ， 只 是 使 用 的 消息 内 容 不 同 。 当 采用 
这 种 异常 设计 方式 的 时 候 ， 异 常 的 处 理 者 只 能 根据 异常 消息 字符 串 的 
内 容 来 判断 具体 的 错误 类 型 。 如 果 异 常 的 处 理 者 只 是 简单 地 进行 日 志 
记录 或 重新 抛 出 此 异常 ， 这 种 方式 并 没有 太 大 的 问题 。 如 果 异 常 的 处 
理 者 需要 解析 异常 的 消息 格式 来 判断 具体 类 型 ， 那 么 这 种 方式 就 是 不 
可 取 的 ， 应 该 换 成 不 同 的 异常 类 。 

采用 这 种 异常 层次 结构 会 遇 到 的 一 个 常见 的 异常 处 理 模 式 是 包装 
异常 。 包 装 异 常 的 目的 在 于 使 异常 只 出 现在 其 所 对 应 的 抽象 层次 上 。 
当 一 个 异常 抛 出 的 时 候 ， 如 果 没 有 被 捕获 到 ， 就 会 一 直 沿 着 调用 栈 往 
上 传递 ， 直 到 被 上 层 方法 捕获 或 是 最 终 由 Java 虚 拟 机 来 处 理 。 这 种 传递 
方式 会 使 这 个 异常 跨越 多 个 抽象 层次 的 边界 ， 使 得 上 层 代 码 看 到 不 需 
要 关注 的 底层 异常 。 为 此 ， 在 一 个 异常 要 跨越 抽象 层次 边界 的 时 候 ， 
需要 进行 包装 。 包 装 之 后 的 异常 才 是 上 层 代码 需要 关注 的 。 

对 一 个 异常 进行 包装 是 一 件 非 常 简单 的 事情 。 从 JDK1.4 开 始 ， 所 
有 异常 的 基 类 java.lang.Throwable 就 支持 在 构造 方法 中 传 入 另外 一 个 异 
常 作为 参数 。 而 这 个 参数 所 表示 的 异常 被 包装 在 新 的 异常 中 ， 可 以 通 
过 getCause 方 法 来 获取 。 下 面 代 码 给 出 了 一 个 异常 包装 的 示例 ， 把 底层 
的 IOException 包装 成 更 为 抽象 的 DataAccessException o 使 用 
DataAccessGateway 类 的 上 层 代 码 只 需要 知道 DataAccessException 即 
可 ， 并 不 需要 知道 IOException 的 存在 。 


代码 清单 3-121 异常 包装 示例 
import java.io.FileInputStream; 
public class DataAccessGateway { 
public void load() throws DataAccessException{ 
try{ 
FileInputStream input = new FileInputStream("data.txt") ; 
}catch (IOException e) { 
throw new DataAccessException (e); 


} 


} 


在 使 用 异常 包装 的 时 候 ， 一 个 典型 的 做 法 就 是 为 每 个 层次 定义 一 
个 基本 的 异常 类 。 这 个 层次 的 所 有 公开 方法 在 声明 异常 的 时 候 都 是 用 
这 个 异常 类 。 所 有 这 个 层次 中 出 现 的 底层 异常 都 被 包装 成 这 个 异常 。 

2. 异 常 类 中 包含 足够 的 信息 

异常 存在 的 一 个 很 重要 的 意义 在 于 ， 当 错误 发 生 的 时 候 ， 调 用 者 
可 以 对 错误 进行 处 理 ， 从 产生 的 错误 中 恢复 。 为 了 方便 调用 者 处 理 这 
些 异常 ， 每 个 异常 中 都 需要 包含 尽量 丰富 的 信息 。 异 常 不 应 该 只 说 明 
某 个 错误 发 生 了 ， 还 应 该 给 出 相关 的 信息 。 异 常 类 是 完整 的 Java 类 ， 
此 在 其 中 添加 所 需 的 域 和 方法 是 一 件 很 简单 的 事情 。 

考虑 这 样 一 个 场景 ， 当 用 户 进行 支付 的 时 候 ， 如 果 他 的 当前 余额 
不 足以 完成 支付 ， 那 么 在 所 抛 出 的 异常 信息 中 ， 可 以 包含 当前 所 需 的 
金额 、 余 额 和 其 中 的 差额 等 信息 。 这 样 异 常 处 理 者 就 可 以 提供 给 用 户 
更 加 具体 的 出 错 信息 。 

Java7 的 异常 处 理 特性 总 结 如 下 。 

1. 一 个 catch 子 句 捕获 多 个 异常 

在 Java7 之 前 的 异常 处 理 语法 中 ， 一 个 catch 子 句 只 能 捕获 一 类 异 
常 。 在 要 处 理 的 异常 种 类 很 多 时 这 种 限制 会 很 抹 烦 。 每 一 种 异常 都 需 
要 添加 一 个 catch 子 句 ， 而 且 这 些 catch 子 句 中 的 处 理 逻 辑 可 能 都 是 相同 
的 ， 从 而 会 造成 代码 重复 。 虽 然 可 以 在 catch 子 句 中 通过 这 些 异 常 的 基 


类 来 捕获 所 有 的 异常 ， 比 如 使 用 Exception 作 为 捕获 的 类 型 ， 但 是 这 要 
求 对 这 些 不 同 的 异常 所 做 的 处 理 是 相同 的 。 另 外 也 可 能 会 捕获 到 某 些 
不 应 该 被 捕获 的 非 受 检 异 常 。 而 在 某 些 情况 下 ， 代 码 重 复 是 不 可 避免 
的 。 比 如 某 个 方法 可 能 抛 出 4 种 不 同 的 异常 ， 其 中 有 2 种 异常 使 用 相同 
的 处 理 方式 ， 另 外 2 种 异常 的 处 理 方式 也 相同 ， 但 是 不 同 于 前 面 的 2 种 
异常 。 这 势必 会 在 catch 子 句 中 包含 重复 的 代码 。 

对 于 这 种 情况 ，Java7 改 进 了 catch 子 句 的 语法 ， 人 允许 在 其 中 指定 多 
种 异常 ， 每 个 异常 类 型 之 间 使 用 “| 来 分 隔 ， 如 代码 清单 3-122 所 示 。 


代码 清单 3-122 Java 改进 catch FAA 
public class ExceptionHandler { 
public void handle (){ 
ExceptionThrower thrower = new ExceptionThrower(); 
try{ 
thrower.manyExceptions(); 


Jcatch(ExceptionA | ExceptionB ab) { 
}catch (ExceptionC c) { 
} 


} 


ExceptionThrower 类 的 manyExceptions 73 法 Hl 出 ExceptionA 、 
ExceptionB #0 ExceptionC — fh EE $$, HA ExceptionA, ExceptionB3K 
用 一 种 处 理 方式 ， 对 ExceptionC 采 用 另外 一 种 处 理 方式 。 

需要 注意 的 是 ，catch 子 句 中 声明 捕获 的 这 些 异常 类 中 ， 不 能 出 现 
重复 的 类 型 ， 也 不 允许 其 中 的 某 个 异常 时 另外 一 个 异常 的 子 类 ， 否 则 
会 出 现 编译 错误 。 如 果 在 catch 子 句 中 声明 了 多 个 异常 类 ， 那 么 异常 参 
数 的 具体 类 型 是 所 有 这 些 异常 类 型 的 最 小 边界 。 

2. 更 加 精确 的 异常 抛 出 

在 进行 异常 处 理 的 时 候 ， 如 果 遇 到 当前 代码 无 法 处 理 的 异常 ， 应 
该 把 异常 重新 抛 出 ， 交 由 调用 栈 的 上 层 代 码 来 处 理 。 在 重新 抛 出 异常 


的 时 候 ， 需 要 判断 异常 的 类 型 。Java7 对 重新 抛 出 异常 时 的 异常 类 型 做 
了 更 加 精确 的 判断 ， 以 保证 抛 出 的 异常 的 确 是 可 以 被 抛 出 的 。 这 个 改 
进 看 起 来 让 人 有 点 费解 ， 因 为 从 语义 上 来 说 ， 不 能 被 抛 出 来 的 异 单 是 
不 会 被 重新 抛 出 的 。 但 是 在 Java7 之 前 ，Java 编 译 器 并 不 能 做 出 精确 的 
判断 ， 因 此 会 存在 一 些 隐 含 的 不 正确 的 情况 。 在 Java7 中 ， 如 果 一 个 
catch 子 句 的 异常 类 型 参数 在 catch 代 码 块 中 没有 被 修改 ， 而 这 个 异常 又 
被 重新 抛 出 ， 编 译 器 会 知道 这 个 重新 被 抛 出 的 异常 肯定 是 try 语 句 块 中 
可 以 抛 出 的 异常 ， 同 时 也 是 没有 被 之 前 的 catch 子 句 捕 获 的 异常 。 下 面 
的 例子 说 明了 Java7 之 前 的 编译 器 和 Java7 编 译 器 不 一 样 的 行为 。 


[13:58 3-123 Java 编译 器 变化 
public class PrecideThrowUse ( 
public void testThrow() throws ExceptionA{ 
tryl 
throw new ExceptionASub2 (); 
}catch (Exception e) { 
try{ 
throw e; 
Jcatch(ExceptionASubl e2 
/ /这 里 会 抛 出 编译 错误 提示 
} 


{ 


} 


在 上 面 的 代码 中 ， 异 常 类 ExceptionASub1 和 ExceptionASub2 都 是 
ExceptionA 的 子 类 ， 而 且 这 两 者 之 间 并 没有 继承 关系 。 方 法 testThrow 中 
首先 抛 出 ExceptionASub2 异 常 ， 通 过 第 一 个 catch 子 句 捕 获 之 后 重新 抛 
出 。 在 这 里 ，Java 编 译 器 可 以 精确 知道 变量 e 表 示 的 异常 类 型 是 
ExceptionASub2， 接 下 来 的 第 二 个 catch 子 句 试 图 捕获 ExceptionASub1 类 
型 的 异常 ， 这 显然 是 不 可 能 的 ， 因 此 会 产生 编译 错误 。 上 面 的 代码 在 
Java6 编 译 器 上 是 可 以 通过 编译 的 。 对 于 Java6 编 译 器 来 说 ， 第 二 个 try 子 
句 中 抛 出 的 异常 类 型 是 前 一 个 catch 子 句 中 声明 的 ExceptionA 类 型 ， 因 此 


在 第 二 个 catch 子 句 中 党 试 捕 获 ExceptionA 的 子 类 型 ExceptionASub1 是 合 
法 的 。 


3.5.3 ExceptionUtils 类 
org.apache.commons.lang3.exception.ExceptionUtils 类 封装 了 


Exception 类 ， 它 们 的 输出 结果 完全 一 致 ， 我 们 可 以 通过 使 用 这 个 类 来 
规避 对 于 底层 Exception 类 的 理解 。 如 代码 清单 3-124 所 示 。 


代码 清单 3-124 ExceptionUtils 类 使 用 示例 
import java.io.File; 
import java.net.URL; 


import java.net.URLDecoder; 
import org.apache.commons.lang3.exception.ExceptionUtils; 


public class testStr { 
public String getProjectPath() throws Exception{ 
String filePath - ""; 
try ( 
URL url = testStr.class.getProtectionDomain () .getCodeSource () .getLocation () ; 
filePath = URLDecoder.decode(url.getPath(), "utf-8"); 
if (filePath.endsWith(".jar")) { 
filePath = filePath.substring(0, filePath.lastIndexOf("/")); 


} 
File file = new File(filePath) ; 


filePath = file.getParent(); 

throw new Exception () ; 
catch (Exception e) { 

System. out.println (ExceptionUtils.getStackTrace (e) ) ; 
catch (Exception e) { 


e.printStackTrace(); 


return filePath; 


public static void main(String[] args) throws Exception{ 
testStr str = new testStr(); 
str.getProjectPath () ; 


程序 运行 后 输出 如 代码 清单 3-125 所 示 。 


代码 清单 3-125 3-124 运行 输出 
java.lang.Exception 
at testStr.getProjectPath(testStr.java:18) 
at testStr.main(testStr.java:27) 


org.apache.commons.lang.exception.ExceptionUtils.getStack Trace 


(e) 的 源 代码 如 代码 清单 3-126 所 示 。 


代码 清单 3-126 getStackTrace 源 代 码 
public static String getStackTrace(Throwable throwable) { 
StringWriter sw = new StringWriter(); 
PrintWriter pw = new PrintWriter(sw, true); 
throwable.printStackTrace (pw); 
return sw.getBuffer().toString(); 
} 


从 上 面 的 运行 输出 我 们 可 以 看 出 ， 异 单 返 回 的 是 String， 直 接 调 用 
Exception 返 回 一 个 StackTraceElement[]。 


3.5.4 循环 技巧 


由 于 方法 的 同步 需要 消耗 相当 多 的 计算 资源 ， 所 以 建议 不 要 在 循 
环 中 调用 synchronized (同步 ) 方法 ， x rendered 法 会 在 第 5 章 
有 较 深入 的 解释 。 如 代码 清单 3-127 所 示 ， 我 们 调用 了 同步 锁 。 


代码 清单 3-127 “同步 锁 示例 
import java.util.vector; 


public class syn ( 


public synchronized void method (object o) ( 
} 
private void test () { 

for (int i = 0; i < vector.size(); itt) { 


method (vector.elementat(i));  // violation 


} 


private vector vector = new vector (5, 5); 


} 


如 上 面 代 码 所 示 ， 此 处 method 方 法 加 入 了 同步 锁 ， 尽 量 不 要 在 循 
环 体 中 调用 同步 方法 ， 如 果 必 须 同 步 的 话 ， 推荐 以 下 方式 ， 如 代码 清 


单 3-128 所 示 。 


代码 清单 3-128 同步 锁 改 进 方案 
import java.util.vector; 
public class syn ( 
public void method (object o) ( 
} 
private void test () { 
synchronized{// 在 一 个 同步 块 中 执行 非 同步 方法 
for (int i = 0; i < vector.size(); i++) ( 


method (Vector,elementat (i)); 


} 


private vector vector = new vector (5, 5); 


} 


BRE fore FP RAZ BEAM, RAOIN. KFA K 
for 循 环 需要 定义 一 个 循环 变量 来 遍历 每 一 个 需要 循环 的 对 象 ， 那 么 如 
果 循 环 次 数 多 的 循环 放 在 外 侧 那么 无 疑 将 会 使 得 总 体 的 变量 增多 ， 效 
率 自然 会 降低 ， 如 代码 清单 3-129 所 示 。 


代码 清单 3-129 ”循环 方法 
public class testFor { 
public static void main(String[] args) { 
long start = System.currentTimeMillis(); 
int count = 0; 
for (int i20; 1<100;it++ )( 
for(int j=0; j«10000000;j*4)| 


counttt; 


} 

System.out.printIn (count); 
System.out.println(System.currentTimeMillis() - start); 
Start = System.currentTimeMillis(); 

count = 0; 

for (int i20; 1<1000000;i++ ) 


for(int j=0; j«100;j*4)( 


countt+; 


} 
System.out.println (count); 


System.out.println(System.currentTimeMillis() - start); 


} 


代码 3-129 运 行 输出 如 代码 清单 3-130 所 示 。 


代码 清单 3-130 3-129 运行 输出 
1000000000 
1092 
100000000 
172 


3.5.5 替换 switch 


关键 字 switch 语 句 用 于 多 条 件 判 断 ，switch 语 句 的 功能 类 似 于 if-else 
语句 ， 两 者 的 性 能 差不多 。 但 是 switch 语 名 有 性 能 提升 空间 ， 如 代码 清 
单 3-131 所 示 。 


代码 清单 3-131 Switch 提升 示例 
public class switchComparelf { 
public static int switchTest(int value) { 
int 1 = value$1041; 
switch (1) { 
case l:return 10; 
case 2:return 11; 
case 3:return 12; 
case 4:return 13; 


:return 15; 


3 
4 

case 5:return 14; 
case 6 
7 


case 7:return 16; 


case 8:return 17; 


case 9:return 18; 
default:return -1; 


} 


public static int arrayTest(int[] value,int key) { 


int i = key%10+1; 


if(i»9 || i<1){ 
return -1; 
else{ 


return value[i]; 


public static void main(String[] args) { 
int chk = 0; 
long start=System.currentTimeMillis(); 
for(int i=0;1<10000000;i++) { 
chk = switchTest (i); 
} 
System.out.println(System.currentTimeMillis () -start); 
chk = 0; 
start=System.currentTimeMillis(); 
int[] value-new int[](0,10,11,12,13,14,15,16,17,18]; 
for(int i1=0;1<10000000;i++) { 
chk = arrayTest (value,i); 
} 


System.out.println(System.currentTimeMillis()-start) ; 


P MN 


使 用 一 个 连续 的 数组 代替 switch 语 句 ， 由 于 对 数据 的 随机 访问 非常 
快 ， 至 少 好 于 switch 的 分 支 判 断 ， 从 上 面 例子 可 以 看 到 比较 的 效率 差距 
是 近乎 1 佑 ，switch 方 法 耗 时 172ms，if-else 方 法 耗 时 93mas。 


3.5.6 优化 循环 


当 性 能 问题 成 为 系统 的 主要 矛盾 时 ， 可 以 尝试 优化 循环 ， 例 如 减 
少 循环 次 效 ， 这 样 可 以 加 快 程序 运行 速度 ， 如 代码 清单 3-132 所 示 。 


代码 清单 3-132 减少 Loop 循环 
public class reduceLoop { 
public static void beforeTuning() { 
long start = System.currentTimeMillis(); 
int[] array = new int[9999999]; 
for(int i1=0;1<9999999;it++) { 


array[i] = i; 


System.out.println(System.currentTimeMillis() - start); 


public static void afterTuning () { 
long start = System.currentTimeMillis(); 
int[] array = new int[9999999]; 
for(int 1-0;1«9999999; i423) ( 
array[i] = i; 
array[itl] = itl; 
array[i*2] = it2; 


} 


System.out.println(System.currentTimeMillis() - start); 


public static void main(String[] args) { 
reduceLoop.beforeTuning(); 


reduceLoop.afterTuning(); 


) 
按照 运行 输出 的 时 间 来 看 ， 这 个 例子 可 以 看 出 ， 通 过 减少 循环 次 
效 ， 耗 时 缩短 为 原来 的 118。 在 循环 体 中 实例 化 临时 变量 将 会 增加 内 存 
消耗 ， 如 代码 清单 3-133 所 示 。 


代码 清单 3-133 循环 体内 实例 化 变量 
import java.util.vector; 
public class loop { 
void method (vector v) { 
for (int i=0;i < v.size();itt) { 
object o = new object () ; 


o = v.elementat (i); 


} 


在 循环 体外 定义 变量 ， 并 反复 使 用 ，3-133 代 码 优 化 成 3-134 所 示 代 
14, 


代码 清单 3-134 循环 体外 方式 
import java.util.vector; 
public class loop { 
void method (vector v) { 
object 0; 
for (int i=0;i<v.size();it+) ( 


o = v.elementat (i); 


3.5.7 使 用 arrayCopy () 


数据 复制 是 一 项 使 用 频率 很 高 的 功能 ，JDK 中 提供 了 一 个 高 效 的 
API 来 实现 它 。System.arraycopy () 函数 是 native 国 数 ， 通 常 native 国 数 


的 性 能 要 优 于 普通 的 函数 ， 所 以 ， 仅 处 于 性 能 考虑 ， 在 软件 开发 中 ， 
应 尽 可 能 调用 native 因 数 。 


ArrayList 和 Vector 大 量 使 用 了 System.arraycopy 来 操作 数据 ， 特 别 是 
同一 数组 内 元 素 的 移动 及 不 同 数组 之 间 元 素 的 复制 。 

arraycopy 的 本 质 是 让 处 理 器 利用 一 条 指令 处 理 一 个 数组 中 的 多 条 
记录 ， 有 点 像 汇 编 语 言 里 面 的 串 操作 指令 (LODSB、LODSW、 
LODSB、STOSB、STOSW、STOSB) ， 只 需 指 定 头 指针 ， 然 后 开始 循 
环 即 可 ， 即 执行 一 次 指令 ， 指 针 就 后 移 一 个 位 置 ， 操 作 多 少数 据 就 循 
环 多 少 次 。 

如 果 在 应 用 程序 中 需要 进行 数组 复制 ， 应 该 使 用 这 个 图 数 ， 而 不 
是 自己 实现 ，arrayCopy 使 用 示例 如 代码 清单 3-135 所 示 。 


代码 清单 3-135 arrayCopy 使 用 示例 
public class arrayCopyTest { 
public static void arrayCopy() { 
int size - 10000000; 
int[] array = new int[size]; 
int[] arraydestination = new int[size]; 
for(int i=0;i<array.length;it+) { 
array[i] = i; 
} 
long start = System.currentTimeMillis(); 
for(int j=0;3>1000;4++) { 
System.arraycopy(array, 0, arraydestination, 0，size);// 使 用 System 级 别 
的 本 地 arraycopy 方式 
} 


System.out.println(System.currentTimeMillis() - start); 


public static void arrayCopySelf () { 

int size = 10000000; 

int[] array = new int[size]; 

int[] arraydestination = new int[size]; 

for(int i=0;i<array.length;itt) { 
array[i] = i; 

} 

long start = System.currentTimeMillis(); 

for(int i=0;i<1000;i++) { 
for(int j=0;j<size;j++){ 

arraydestination[j] = array[j];// 自 己 实现 的 方式 ， 采 用 数组 的 数据 互 换 方 式 


} 
System.out.println(System.currentTimeMillis() - start); 


public static void main(String[] args) { 
arrayCopyTest.arrayCopy(); 
arrayCopyTest.arrayCopySelf(); 


代码 3-135 运 行 输出 如 清单 3-136 所 示 。 


代码 清单 3-136 3-135 运行 输出 
023166 


3.5.8 使 用 Buffer 进 行 IO 操 作 


除 NIO 外 ， 使 用 Java 进 行 UO 操 作 有 两 种 基本 方式 ， 一 是 使 用 基于 
InputStream 和 OutputStream 的 方式 ， 二 是 使 用 Writer 和 Reader。 

无 论 使 用 哪 种 方式 进行 文件 1O， 如 果 能 合理 地 使 用 缓冲 ， 就 能 有 
效 地 提高 IO 的 性 能 。 

下 面 显 示 了 可 与 InputStream、 OutputStream, Writer 和 Reader 配 套 
使 用 的 缓冲 组 件 。 


OutputStream-FileOutputStream-BufferedOutputStream 
InputStream-FileInputStream-BufferedInputStream 
Writer-FileWriter-BufferedWriter 


Reader-FileReader-BufferedReader 


使 用 缓冲 组 件 对 文件 IO 进行 包装 ， 可 以 有 效 提高 文件 IO 的 性 能 ， 
如 代码 清单 3-137 所 示 。 


代码 清单 3-137 使 用 缓冲 组 件 

import java.io.BufferedInputStream; 
import java.io.BufferedOutputStream; 
import java.io.DataInputStream; 
import java.io.DataOutputStream; 
import java.io.FileInputStream; 
import java.io.FileNotFoundException; 
import java.io.FileOutputStream; 


import java.io.IOException; 


public class StreamVSBuffer { 
public static void streamMethod() throws IOException{ 
try { 
long start = System.currentTimeMillis(); 
DataOutputStream dos = new DataOutputStream(new FileOutputStream 
("C:\N\StreamVSBuffertest,txt") ) ; // 请 替换 成 自己 的 文件 
for(int i20;1«10000;i*4)[ 
dos ,WriteBytes (String.valueOf (i)+"\r\n") ;//M 1 万 次 写 入 数据 
} 


dos.close(); 

DataInputStream dis = new DataInputStream (new 
FileInputStream("C:\\StreamVSBuffertest.txt")); 

while(dis.readLine() != null) { 

} 

dis.close(); 

System.out.println(System.currentTimeMillis() - start); 


} catch (FileNotFoundException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


public static void bufferMethod() throws I0Exception{ 
try ( 

long start = System.currentTimeMillis(); 

DataOutputStream dos = new DataOutputStream (new 
BufferedOutputStream(new FileOutputStream("C:\\StreamVSBuffertest.txt"))) ;// 请 替换 成 
自己 的 文件 

for(int i20;1«10000;i*4)( 

dos .writeBytes (String.valueOf (i)+"\r\n") ; / / AA 1 万 次 写 入 数据 

} 

dos.close(); 

DataInputStream dis = new DataInputStream(new BufferedInputStream (new 
FileInputStream("C:\\StreamVSBuffertest.txt"))); 

while (dis.readLine() != null) { 


} 

dis.close(); 

System.out.println(System.currentTimeMillis() - start); 
} catch (FileNotFoundException e) { 

// TODO Auto-generated catch block 


e.printStackTrace(); 


public static void main(String[] args) { 
try { 
StreamVSBuffer.streamMethod () ; 
StreamVSBuffer.bufferMethod () ; 
} catch (IOException e) { 
// TODO Auto-generated catch block 
e.printStackTrace () ; 


从 代码 清单 3-137 的 输出 〈 分 别 为 889 和 31 毫 秒 ) 我 们 可 以 看 到 ， 很 
明显 使 用 缓冲 的 代码 性 能 比 没 有 使 用 缓冲 的 快 了 很 多 倍 。 

下 面 的 代码 对 FileWriter 和 FileReader 进 行 了 相似 的 测试 ， 如 代码 清 
单 3-138 所 示 。 


代码 清单 3-138 FileWriterVSFileReader 


im 
im 
im 
im 
im 
im 


im 


im 


port j 
port 
port 
port 
port 
port 
port 


port 


ava. 
java. 
java. 
java. 
java. 
java. 
java. 


java. 


io.BufferedInputStream; 
io.BufferedOutputStream; 
io.BufferedReader; 
io.BufferedWriter; 
io.FileNotFoundException; 
io.FileReader; 
io.FileWriter; 


io.IOException; 


public class WriterVSBuffer { 
public static void streamMethod() throws IOException( 
try { 
long start - System.currentTimeMillis(); 
FileWriter fw = new FileWriter("C:NMStreamVSBuffertest.txt");//ih dd 
成 自己 的 文件 
for(int i=0;i<10000;i++) { 
fw.write (String. valueOf (i)+"\r\n") ;//MAR1 BREAK 
} 
fw.close(); 
FileReader fr = new FileReader ("C:\\StreamvSBuffertest.txt") ; 
while(fr.ready() != false) { 


} 

fr.close(); 

System. out.println(System.currentTimeMillis() - start); 
} catch (FileNotFoundException e) { 

// TODO Auto-generated catch block 

e.printStackTrace(); 


public static void bufferMethod() throws IOException( 
try ( 

long start - System.currentTimeMillis(); 

BufferedWriter fw = new BufferedWriter(new FileWriter("C:\\ 
StreamVSBuffertest .txt") ) ;// 请 替换 成 自己 的 文件 

for(int i=0;i<10000; i++) { 

fw.write (String.valueOf (i)+"\r\n");// 循 环 1 万 次 写 入 数据 

} 

fw.close(); 

BufferedReader fr = new BufferedReader (new FileReader ("C:\\ 
StreamVSBuffertest.txt")); 

while(fr.ready() != false)( 


} 

fr.close(); 

System.out.println(System.currentTimeMillis() - start); 
} catch (FileNotFoundException e) { 

// TODO Auto-generated catch block 


e.printStackTrace(); 


public static void main(String[] args) { 
try { 
StreamVSBuffer.streamMethod(); 


StreamVSBuffer.bufferMethod(); 
} catch (IOException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


} 


从 上 面 例子 的 输出 (4327312958131 £^) 可 以 看 出 ， 无 论 对 于 
读 取 还 是 写 入 文件 ， 适 当地 使 用 缓冲 ， 可 以 有 效 地 提升 系统 的 文件 读 
写 性 能 ， 为 用 户 减 少 响 应 时 间 。 


3.5.9 使 用 clone () 代替 new 


在 Java 中 新 建 对 象 实例 最 常用 的 方法 是 使 用 new 关 键 字 。JDK 对 
new 关 键 字 的 支持 非常 好 ， 使 用 new 关 键 字 创建 轻 量 级 对 象 时 ， 速 度 非 
常 快 。 但 是 ， 对 于 重量 级 对 象 ， 由 于 对 象 在 构造 水 数 中 可 能 会 进行 一 
些 复 杂 且 耗 时 的 操作 ， 因 此 ， 构 造 水 数 的 执行 时 间 可 能 会 比较 长 。 这 
就 导致 创建 对 象 的 耗 时 很 长 ， 同 时 也 使 得 系统 无 法 在 短期 内 获得 大 量 
的 实例 。 为 了 解决 这 个 问题 ， 可 以 使 用 Objectclone () 方法 。 
Object.clone () 方法 可 以 绕 过 对 象 构造 辆 数 ， 快 速 复制 一 个 对 象 实 
例 。 由 于 不 需要 调用 对 象 构造 疯 数 ， 因 此 ，dlone 0 方法 不 会 受到 构 
造 水 数 性 能 的 影响 ， 能 够 快速 生成 一 个 实例 。 但 是 ， 在 默认 情况 下 ， 
clone () 方法 生成 的 实例 只 是 原 对 象 的 浅 拷 贝 。 如 果 需 要 深 拷 贝 ， 则 
需要 重新 实现 clone () 方法 。 

下 面 这 个 例子 是 一 个 实现 了 Cloneable 接 口 的 JavaBean， 它 拥有 一 个 
通过 clone () 方法 生成 新 实例 的 newInstance () 国 数 。 此 外 ， 它 的 构 
造 永 数 性 能 较 差 ， 通 过 构造 函数 生成 对 象 的 效率 很 低 。 


代码 清单 3-139 Cloneable 接口 实现 
import java.util.Vector; 


import org.apache.hadoop.hbase.util.Threads; 


public class cloneDemo implements Cloneable{ 
private int id; 
private String str; 
private Vector v; 
public cloneDemo() throws InterruptedException( 
Thread.sleep (1000); 


System.out.println("Constructor called"); 


public int getId() { 


return id; 


public void setId(int id) { 
this.id = id; 


public String getStr() { 


return str; 


public void setStr(String str) { 


this.str - str; 


public Vector getvVv() { 


return v; 


public void setV(Vector v) { 


this.v = v; 


public cloneDemo newInstance ()í 
try{ 
return (cloneDemo)this.clone();//1&Jl] clone 方法 创建 对 象 ， 属 于 浅 找 贝 
)catch(CloneNotSupportedException ex) { 
ex.printStackTrace(); 
) 


return null; 


public static void main(String[] args) throws InterruptedException{ 
long start = System.currentTimeMillis(); 
cloneDemo cl = new cloneDemo(t); 
System.out.println(System.currentTimeMillis() - start); 
Vector v = new Vector(); 
v.add("java"); 
Cl.setld(1); 
cl.setStr ("testi"); 
cl.setV(v); 


start = System.currentTimeMillis(); 
cloneDemo c2 = cl.newInstance(); 
System.out.println(System.currentTimeMillis() - start); 


c2.setId(2); 
c2.setStr("test2"); 
G2.getV().add ("cer"); 


System.out.println ("cl==c2?"+ (cl==c2) ); 
System.out.printin(cl.getV()==c2.getV()); 
System.out.printin(cl.getStr()); 
System.out.printin(cl.getId()); 
System.out.println(c2.getStr()); 
System.out.println(c2.getId()); 


} 


代码 3-139 运 行 输出 如 清单 3-140 所 示 。 


代码 清单 3-140 3-139 运行 输出 
Constructor called 
1014 
0 
cl==c2?false 
true 
testl 
1 
test2 
2 


如 果 需 要 实现 深 拷贝 ， 则 需要 重 载 Object 对 象 的 Clone O 方法 。 首 
先 使 用 superclone () 方法 生成 一 份 浅 拷贝 对 象 。 然 后 ， 生 成 一 个 新 的 
Vector 实例 ， 将 原 实 例 内 容 复 制 到 新 的 实例 中 ， 使 克隆 后 的 对 象 与 原 对 
象 持 有 不 同 的 引用 ， 实 现 了 简单 的 深 拷贝 


3.5.10 W/O 速度 


对 于 CPU 密集 型 的 程序 ， 即 程序 中 包含 大 量 计算 ，Java 程 序 可 以 达 
到 C/C++ 程 序 同 等 级 别 的 速度 ， 但 是 对 于 IO 密集 型 的 程序 ， 即 程序 中 
包含 大 量 WO 操 作 ，Java 程 序 的 速度 就 远 远 慢 于 C/C++ 程序 了 ， 很 大 程度 
上 是 因为 C/C++ 程序 能 直接 访问 底层 的 存储 设备 。 

在 Java VO 中 最 基本 的 概念 是 流 (Stream) ， 流 是 一 个 连续 的 字 
序列 ， 包括 输入 流 和 输出 流 ， 输入 流 用 来 读 取 这 个 序列 ， 而 输出 流 则 
用 来 写 这 个 序列 ， 在 默认 情况 下 Java 的 流 操 作 是 基于 字 节 的 ， 即 一 次 只 
读 或 只 写 一 个 字 节 。 

Java.1/O @ #2 # T InputStream 4 OutputStream {F Wy Xt 1/0 #2 (FAY Fh 
象 ， 这 两 个 接口 决定 了 类 层次 结构 的 基本 格局 。 


导致 O 性 能 低下 的 主要 原因 是 没有 对 IO 操作 进行 缓冲 。 众 所 周 
知 ， 硬 盘 擅长 于 大 块 数据 的 读 写 ， 但 是 在 小 量 数据 的 读 瑟 上 性 能 不 
好 ， 所 以 ， 为 了 最 大 化 oO 性能， 我 们 应 该 选择 批量 的 数据 操作 ， 而 缓 
冲 流 正 是 为 这 个 目的 设计 的 。 缓 冲 流 ， 包 括 BufferedInputStream 和 
BufferedOutputStream， 它 为 W/O 流 增 加 了 内 存 缓冲 区 ， 使 得 Java 程 序 一 
次 可 以 向 底层 设备 写 入 或 者 读 取 大 量 数 据 ， 从 而 提高 了 程序 的 性 能 。 
具体 的 实现 过 程 中 ， 缓 冲 流 将 每 一 个 小 的 读 写 请 求 积攒 起 来 ， 然 后 一 
次 性 地 批 处 理 ， 通 常 是 将 几 千 个 读 写 请 求 合并 成 一 个 大 的 请 求 。 

缓冲 流 虽 然 在 它 的 内 部 增加 了 内 存 缓冲 区 ， 使 得 在 缓冲 区 和 底层 
设备 之 间 写 入 或 读 取 大 量 数据 成 为 可 能 ， 但 是 在 这 之 上 的 Java 程 序 依然 
使 用 while 循 环 从 该 流 (实际 上 是 缓冲 数组 ) 按 字 节 读 写 数据 。 由 于 组 
冲 数组 的 大 小 是 固定 的 ，JVM 需 要 针对 数组 做 越界 检查 ， 该 操作 会 导 
致 额外 的 系统 开销 。 另 一 方面 ， 为 了 支持 多 线程 环境 ， 将 数据 从 
BufferedInputStream 的 缓冲 数组 拷贝 到 BufferedOutputStream 的 缓冲 数 
组 ， 其 中 的 方法 调用 很 多 都 是 synchronized， 这 也 会 导致 额外 的 系统 开 
销 。 我 们 可 以 通过 利用 硬盘 擅长 读 写 大 块 数据 的 特性 ， 建 立 上 自己 的 缓 
冲 区 ， 避 免 上 述 额 外 的 系统 开销 。 注 意 ， 使 用 这 个 策略 需要 权衡 两 个 
因素 。 首 先是 缓冲 区 的 大 小 ， 它 所 创建 的 缓冲 区 的 大 小 等 于 被 拷贝 的 
文件 大 小 ， 当 文件 很 大 时 ， 该 缓冲 区 也 会 很 大 。 第 二 ， 它 为 每 次 文件 
拷贝 操作 都 要 创建 一 个 新 的 缓冲 区 ， 当 有 大 量 文件 需要 拷贝 时 ，JVM 
不 得 不 分 配 和 回收 这 些 大 缓冲 区 内 存 ， 这 对 程序 性 能 是 极 大 的 伤害 。 

如 何在 保持 速度 的 前 提 下 避免 这 两 个 缺陷 呢 ?” 方法 是 这 样 的 : 我 
们 可 以 创建 一 个 静态 的 固定 长 度 的 字 节 数组 ， 如 1024x1024 字 节 即 
1MB， 每 次 只 读 写 1MB 的 数据 。 虽 然 对 于 大 于 1MB 的 文件 会 需要 多 次 
读 写 才能 完成 整个 文件 的 拷贝 ， 但 是 这 样 避免 了 内 存 的 反复 分 配 和 回 
收 。 缓 冲 区 大 小 是 可 以 调整 的 ， 针 对 某 个 具体 的 应 用 场景 ， 我 们 可 以 
在 速度 和 内 存 之 间 取 得 一 个 最 佳 的 平衡 。 

一 般 情 况 下 ， 我 们 总 是 可 以 为 具体 的 应 用 程序 找到 改善 MO 性 能 的 
方法 ， 这 需要 具体 分 析 该 应 用 程序 的 目的 和 操作 特性 。 例 如 ， 考 虑 FTP 
和 HTTP 服 务 器 ， 这 些 服务 器 的 主要 工作 就 是 将 文件 从 磁盘 拷贝 到 网 络 
的 Socket， 一 个 网 站 的 主页 通常 比 其 他 网 页 访问 得 更 多 。 为 了 提高 ' 
能 ， 我 们 可 以 建立 快速 缓冲 存储 区 ， 将 那么 经 常 被 访问 的 文件 缓存 起 


来 ， 这 样 这 些 文件 就 不 必 每 次 从 磁盘 读 写 ， 而 是 直接 从 内 存 拷贝 到 网 
络 


Ho 


3.5.11 Finally 方 法 里 面 释放 或 者 关闭 资源 占用 


程序 中 使 用 到 的 资源 应 当 被 释放 ， 以 避免 资产 泄漏 ， 这 个 步 又 最 
好 是 放 在 finally 块 中 去 做 。 不 管 程序 执行 的 BRU, A 
被 执行 的 ， 以 确保 资源 的 正确 关闭 。 如 代码 清单 3-141 所 示 。 


代码 清单 3-141 释放 资源 示例 
import java.io.*; 
public class cs ( 
public static void main (string args[]) { 
CS CS = new cs (); 
cs.method (); 
} 
public void method () { 
fileinputstream fis = null; 
try { 
fis = new fileinputstream ("cs.java"); 
int count - 0; 
while (fis.read () != -1) 
countt*; 
system.out.println (count); 
) catch (filenotfoundexception el) { 
) catch (ioexception e2) { 
}finally{ 
fis.close (); 


} 


3.5.12 资源 管理 机 制 


对 于 资产 管理 ， 大 多 数 开 发 人 员 都 知道 的 一 条 原则 是 : 谁 申请 ， 
谁 释放 。 这 些 资源 涉及 操作 系统 中 的 主 存 、 磁 盘 文 件 、 网 络 连 接 和 数 
据 库 连接 等 。 凡 是 数量 有 限 的 、 需 要 申请 和 释放 的 实体 ， 都 应 该 纳入 
到 资源 管理 的 范围 中 来 。 

对 于 C++ 程 序 员 来 说 ， 程 序 的 内 存 管 理 是 他 们 的 一 项 职责 。 他 们 需 
要 保证 每 一 块 申 请 的 内 存 都 在 正确 的 地 方 得 到 了 释放 ， 要 么 在 构造 函 
数 中 申请 ， 在 析 构 函数 中 释放 ， 要 么 使 用 类 似 智能 指针 一 样 的 结构 来 
实现 资源 管理 。Java 语 言 把 内 存 管理 的 任务 交 给 了 Java 虚 拟 机 ， 通 过 自 
动 垃 圾 回收 机 制 碱 少 了 开发 人 员 的 很 多 工作 。 但 是 像 输入 输出 流 和 数 
据 库 连 接 这 样 的 资源 ， 还 是 需要 开发 人 员 手 动 释放 的 。 

在 使 用 资源 的 时 候 ， 有 可 能 会 抛 出 各 种 异常 ， 比 如 读 取 磁盘 文件 
和 访问 数据 库 时 都 可 能 出 现 各 种 不 同 的 异常 。 而 资源 管理 的 一 个 要 求 
就 是 不 管 操作 是 否 成 功 ， 所 申请 资产 都 要 被 正确 释放 。 通 过 try-catch- 
finally 语 句 块 的 finally 语 句 进行 资源 释放 操作 ， 这 种 方式 虽然 比较 易 
懂 ， 但 是 其 中 包含 的 见 余 代码 比较 多 。 为 了 简化 这 种 典型 的 应 用 ， 
Java7 对 try 语 句 进 行 了 增强 ， 使 它 可 以 支持 对 资源 进行 的 管理 ， 保 证 资 
源 总 是 被 正确 释放 。 即 资源 的 申请 是 在 try 子 句 中 进行 的 ， 而 资源 的 释 
放 则 是 自动 完成 的 。 在 使 用 try-with-resource 语 句 的 时 候 ， 异 常 可 能 发 
生 在 try 语 句 中 ， 也 可 能 发 生 在 释放 资源 时 。 如 果 资 源 初始 化 时 或 try 语 
句 中 出 现 异常 ， 而 释放 资源 的 操作 正常 执行 ，try 语 句 中 的 异常 会 被 抛 
出 ， 如 果 try 语 句 和 释放 资源 都 出 现 了 异常 ， 那 么 最 终 抛 出 的 异常 是 try 
语句 中 出 现 的 异常 ， 在 释放 资源 时 出 现 的 异常 会 作为 被 抑制 的 异常 添 
加 进去 ， 即 通过 Throwable.addSuppressed 方 法 来 实现 。 

能 够 被 try 语 句 所 管理 的 资源 需要 满足 一 个 条 件 ， 那 就 是 其 Java 类 
要 实现 java.lang.AutoCloseable 接 口 ， 否 则 会 出 现 编译 错误 。 当 需要 释放 
资源 的 时 候 ， 该 接口 的 Close 方法 会 被 自动 调用 。Java 类 库 中 已 有 不 少 接 
口 或 类 继承 或 实现 了 这 个 接口 ， 使 得 它们 可 以 用 在 try 语 句 中 。 在 这 些 
已 有 的 常见 接口 或 类 中 ， 最 常用 的 就 是 与 IO 操作 和 数据 库 相 关 的 接 
口 。 与 IO 相关 的 java.io.Closeable 继 承 了 AutoCloseable ， 而 与 数据 库 相 
关 的 java.sql.Connection、java.sql.ResultSet 和 java.sql.Statement 也 继承 了 


该 接口 。 如 果 和 希望 自己 开发 的 类 也 能 利用 try 语 句 的 自动 化 资产 管理 ， 
只 需要 实现 AutoCloseable 接 口 即 可 ， 如 代码 清单 3-142 所 示 。 


代码 清单 3-142 SCH AutoCloseable 接口 


public class CustomeResource implements AutoCloseable{ 


@Override 

public void close() throws Exception { 
// TODO Auto-generated method stub 
System.out .println ("进行 资源 释放 。"); 


public void useCustomResource() throws Exception{ 
try(CustomResource resource = new CustomResource()) { 
System,out .println(" 使 用 资源 。") 


} 


当 对 多 个 资源 进行 管理 的 时 候 ， 在 释放 每 个 资源 时 都 可 能 会 产生 
异常 。 所 有 这 些 异 常 都 会 被 加 到 资产 初始 化 异常 或 try 语 句 块 中 抛 出 的 
异常 的 被 抑制 异常 列表 中 。 在 try-with-reource 语 句 中 也 可 以 使 用 catch 和 
finally 子 句 。 在 catch 子 句 中 可 以 捕获 try 语 句 块 和 释放 资源 时 可 能 发 生 的 
各 种 异常 。 


3.5.13 牺牲 CPU 时 间 


时 间 换 空间 通常 用 于 家 入 式 设 备 ， 或 者 内 存 、 宣 盘 空 间 不 足 的 情 
况 。 通 过 使 用 牺牲 CPU 的 方式 ， 获 得 原本 需要 更 多 内 存 或 者 硬盘 空间 
才能 完成 的 工作 。 

一 个 非常 简单 的 时 间 换 空间 的 算法 ， 实 现 了 a、b 两 个 变量 的 值 交 
换 。 交 换 两 个 变量 最 常用 的 方法 是 使 用 一 个 中 间 变 量 ， 而 引入 额外 的 


变量 意味 着 要 使 用 更 多 的 空间 。 采 用 代码 清单 3-143 所 示 的 方法 可 以 免 
去 中 间 变 量 ， 而 达到 变量 交换 的 目的 ， 其 代价 是 引入 了 更 多 的 CPU 运 
算 。 


代码 清单 3-143 fime 
a-atb; 
b-a-b; 


a-a-b; 


另 一 个 较为 有 用 的 例子 是 对 无 符号 整数 的 支持 。 在 Java 语 言 中 ,不 
支持 无 符号 整数 ， 这 意味 着 当 需 要 无 符号 的 byte 时 ， 需 要 使 用 short 代 
替 ， 这 也 意味 着 空间 的 浪费 。 下 面 代 码 演示 了 使 用 位 运算 模拟 无 符号 
byte。 昌 然 在 取 值 和 设 值 过 程 中 需要 更 多 的 CPU 运 算 ， 但 是 可 以 大 大 降 
低 对 内 存 空间 的 需求 。 


代码 清单 3-144 无 符号 整数 方式 
public class UnsignedByte { 
public short getValue (byte i) {// 将 pyte 转 为 无 符号 的 数字 
short li = (short) (1 & Oxff); 


return li; 


public byte toUnsignedByte (short i) { 


kk n 


return (byte) (i & Oxff);//# short HALA byte 


public static void main(String[] args) { 

UnsignedByte ins = new UnsignedByte(); 

short[] shorts = new short[256];// 声 明 一 个 short 数组 

for(int i=0;i<shorts.length; itt) {// 数 组 不 能 超过 无 符号 byte 的 上 限 
shorts[i]=(short)i; 

} 

byte[] bytes = new byte[256] ;// 使 用 byte 数组 替代 short 数组 

for(int 1=0;i<bytes.length;itt) { 
bytes [i]-ins.toUnsignedByte (shorts [i]) ; //short 数组 的 数据 存 到 byte 数组 中 


} 
for(int i=0;i<bytes. length; i++) { 


System.out.println(ins.getValue (bytes[i])*" ");//M byte 数组 中 取出 无 符号 
的 byte 


代码 3-144 运 行 输出 如 清单 3-145 所 示 。 


代码 清单 3-145 3-144 运行 输出 
0 


DO wo Ss cy A A O NM dq 


255 


如 果 CPU 的 能 力 较 弱 ， 可 以 采用 牺牲 空间 的 方式 提高 计算 能 力 ， 
实例 如 代码 清单 3-146 所 示 。 


代码 清单 3-146 牺牲 空间 方式 
import java.util.Arrays; 
import java.util.HashMap; 


import java.util.Map; 


public class SpaceSort { 
public static int arrayLen - 1000000; 


public static void main(String[] args) { 


int[] a = new int[arrayLen]; 
int[] old = new int[arrayLen]; 
Map<Integer,Object> map = new HashMap<Integer, Object>(); 
int count = 0; 
while(count < a.length) { 
// 初 始 化 数组 
int value = (int) (Math.random() *arrayLen*10)+1; 
if (map.get (value) ==null1) { 
map.put (value, value); 
a[count] = value; 


count-tt; 


) 
System.arraycopy(a, 0, old, 0, a.length);//A a KAY WPA RES old 数组 
long start = System.currentTimeMillis(); 
Arrays.sort (a); 
System.out.println("Arrays.sort spend:"+(System.currentTimeMillis() - start)+"ms"); 
System.arraycopy(old, 0, a, 0，old.length);// 恢 复原 有 数据 
start = System.currentTimeMillis(); 
spaceTotime (a); 
System.out.println("spaceTotime spend:"+(System.currentTimeMillis() - start)+"ms") ; 


} 


public static void spaceTotime(int[] array) { 
int i= 0; 
int max = array[0]; 
int 1 = array.length; 
for (i=1;i<1l;i++) { 
if (array[i]>max) { 


max = array[il]; 


} 

int[] temp = new int[max-*1]; 

for (i=0;i<l;itt) { 
temp[array[i]] = array[il]; 

} 

int j = 0; 

int maxl = max + 1; 

for (i=0; i<max1;i++) { 
if(temp[i] > 0){ 


array[j++] = temp[i]; 


国 数 spaceToTime () 实现 了 数组 的 排序 。 它 不 计 空间 成 本 ， 以 数 
组 的 索引 下 标 来 表示 数据 大 小 ， 因 此 避免 了 数字 间 的 相互 比较 。 这 是 
一 种 典型 的 以 空间 换 时 间 的 思路 。 


3.5.14 对 象 操 作 


在 java.util 包 中 新 增 了 一 个 用 来 操作 对 象 的 工具 类 java.util.Objects。 
Objects 类 中 包含 的 都 是 静态 方法 ， 通 过 这 些 方法 可 以 快速 对 对 象 进行 
操作 。 

在 进行 两 个 对 象 的 比较 操作 时 ， 可 以 使 用 Objects 类 的 compare 方 
法 。 一 般 来 说 ， 进 行 对 象 比 较 是 先 由 Java 类 实现 java.lang.Comparable 接 
口 ， 再 通过 compareTo 方 法 来 进行 比较 。 如 果 对 集合 中 的 元 素 进 行 排 
序 ， 那 么 还 会 用 到 java.util.Comparator 接 口 的 实现 。Objects 类 中 的 
compare 方 法 可 以 将 两 个 对 象 通过 特定 的 Comparator 接 口 的 实现 对 象 来 
进行 比较 。 

判断 对 象 相等 的 方式 一 般 是 调用 Object 类 的 equals 方 法 ， 如 判断 两 
个 对 象 a 和 b 是 否 相 等 ， 可 以 使 用 代码 “a.equals (b) ”。Objects 类 的 
equals 方 法 可 以 直接 判断 两 个 对 象 是 否 相 等 ， 如 “Objects.edquals (a, 
b) ”。 此 方法 的 一 个 好 处 是 会 对 null 值 进行 处 理 。 如 果 直 接 调 用 一 个 对 
象 的 equals 方 法 ， 需 要 先 判断 这 个 对 象 是 否 为 null， 而 使 用 Objects 类 的 
equals 方 法 则 不 需要 。 如 果 Objects 类 的 equals 方 法 调用 时 的 两 个 参数 的 
值 都 是 null， 则 判断 结果 是 true。 第 二 如 果 只 有 一 个 参数 为 null， 则 判断 
结果 是 false; 如果 两 个 参数 都 不 为 null， 则 调用 第 一 个 参数 的 equals 方 
法 来 进行 判断 。Objects 类 与 equals 方 法 作用 相似 的 是 deepEquals 方 法 ， 
利用 该 方法 也 可 以 对 两 个 对 象 进 行 相 等 性 判断 。 与 equals 方 法 不 同 的 
是 ， 如 果 deepEquals 方 法 的 两 个 参数 都 是 数组 ， 则 会 调用 java.util.Arrays 
类 的 deepEquals 来 进行 比较 。 Arrays 类 的 deepEquals 方 法 在 进行 数组 比 
较 时 ， 会 考虑 数组 中 的 所 有 元 素 的 相等 性 。 在 其 他 情况 下 ，deepEquals 
方法 和 equals 方 法 的 作用 是 相同 的 。 

Objects 类 中 的 hashCode 方 法 可 以 用 来 获取 对 象 的 哈 希 值 。 如 果 参 
数 为 null， 那 么 返回 值 是 0; 是 否 返 回 值 是 参数 对 象 的 hashCode 方 法 的 
返回 结果 。 如 果 需 要 计算 一 组 对 象 的 哈 希 值 ， 那 么 可 以 使 用 Objects 类 
的 hash 方 法 。Objects 类 的 hash 方 法 的 实现 使 用 的 是 Arrays 类 中 的 


hashCode 方 法 。 需 要 注意 的 是 ， 在 调用 hash 方 法 时 传 入 耽 搓 对 象 作为 参 
数 的 返回 结果 ， 与 使 用 同样 的 参数 调用 hashCode 方 法 的 结果 并 不 相 
同 。 

Objects 中 还 有 一 组 用 于 获取 对 象 的 字符 串 表 示 的 toString 方 法 的 不 
同 重 载 形 式 。Objects 的 toString 方 法 在 参数 为 null 时 返回 值 是 “Null*， 而 
在 其 他 情况 下 相当 于 调用 参数 对 象 的 toString 方 法 。 如 果 希 望 在 参数 为 
null 时 返回 给 定 的 内 容 作 为 提示 信息 ， 那 么 可 以 使 用 toString 方 法 的 另外 
一 个 重 载 形 式 ， 即 通过 一 个 额外 的 参数 来 制定 参数 值 为 null 时 的 返回 结 
果 。 


3.5.15 正则 表达 式 


Java7 对 java.utilregex 包 中 的 内 容 进 行 了 更 新 ， 主 要 包括 以 下 几 个 
方面 。 

1. 支 持 命 名 捕获 分 组 

捕获 分 组 (capturing group) 在 使 用 正则 表达 式 从 文本 中 获取 某 种 
模式 的 部 分 字符 时 非常 有 用 。 通 过 把 感 兴 趣 的 字符 串 的 模式 封装 在 捕 
获 分 组 中 ， 可 以 在 匹配 之 后 很 容易 地 获取 这 些 内 容 。 另 外 捕获 分 组 也 
可 以 在 正则 表达 式 中 以 后 向 引用 (back reference) 的 方式 来 直接 使 用 ， 
以 表示 相同 的 模式 。 在 Java7 之 前 ， 对 捕获 分 组 的 引用 只 支持 使 用 表示 
出 现 顺序 的 数字 形式 。 这 体现 在 java.util.Matcher 类 的 group 方 法 只 接受 
int 类 型 作为 参数 ， 后 向 引用 的 语法 也 仅 支 持 类 似 A^1” 这 样 的 形式 。 如 果 
一 个 正则 表达 式 中 包含 很 多 捕获 分 组 ， 那 么 开发 人 员 需 要 清除 每 个 数 
字 所 代表 的 捕获 分 组 的 含义 ， 这 对 于 代码 的 编写 者 和 阅读 者 来 说 都 是 
一 件 很 噬 烦 的 事情 。Java7 引 入 的 命名 捕获 分 组 可 以 很 好 地 解决 这 个 问 
题 。 通 过 为 每 个 捕获 分 组 添加 一 个 有 意义 的 名 字 ， 使 开发 人 员 可 以 很 
容易 地 明白 每 个 分 组 所 表示 的 含义 ， 这 比 使 用 无 意义 的 数字 要 方便 很 
多 。 

下 面 代码 给 出 了 通过 命名 捕获 分 组 来 匹配 字符 串 并 提取 内 容 时 的 
用 法 。 待 匹配 的 字符 串 是 一 个 URL ， 其 中 通过 路 径 的 不 同 部 分 来 表示 
查询 参数 的 名 称 和 值 。 这 种 采用 路 径 而 不 是 查询 字符 串 来 指明 参数 的 
方式 ， 在 目前 的 Web 开 发 中 比较 常见 。 在 正则 表达 式 的 模式 中 ， 为 提取 
每 个 参数 内 容 的 捕获 分 组 都 指定 了 一 个 有 意义 的 名 字 。 当 匹配 完成 之 


后 ， 可 以 通过 Matcher 类 的 group 方 法 来 获取 每 个 捕获 分 组 的 内 容 ， 人 参数 
是 在 模式 中 指定 的 名 字 。 采 用 “? < > ”格式 为 一 个 捕获 分 组 命名 , “< 
> ”中 的 内 容 是 名 称 。 名 称 必须 由 大 小 写 英 文字 母 和 数字 组 成 ， 同 时 第 
一 个 字符 必须 是 字母 ， 获 取 分 组 的 方式 如 代码 清单 3-147 所 示 。 


代码 清单 3-147 ”获取 分 组 方式 
import java.util.regex.Matcher; 


import java.util.regex.Pattern; 


public class namedCapturingGroup { 
public static void main(String[] args) { 
String url = "http://www.example.org/uid/alex/docid/1/title/MyFirstBlog"; 
Pattern pattern = 
Pattern. compile ("*.*/uid/(?<uid>.*) /docid/ (?<docid>.*) /title/(?<title>.*)"); 
Matcher matcher = pattern.matcher (url); 
if (matcher.matches () ) { 
String uid = matcher.group ("uid"); 
String docId = matcher.group("docId") ; 
String title = matcher.group ("title"); 
System. out.println (uid); 
System. out.println(docId) ; 
System.out.println (title); 


} 


捕获 分 组 的 名 称 也 可 以 用 在 正则 表达 式 之 中 ， 用 来 替换 使 用 数字 
来 进行 后 向 引用 的 做 法 。 

2. 使 用 “^\X” 表 示 Unicode 中 的 代码 点 

在 正则 表达 式 中 ， 要 引用 Unicode 字 符 时 ， 可 以 通过 ‘“^\uXXX” 的 形 
式 ， 如 “\u0030” 表 示 数 字 “0”。 通 过 这 种 方式 可 以 表示 某 些 无 法 在 源 代 
码 中 直接 出 现 的 字符 ， 比 如 无 法 输入 汉字 的 开发 人 员 可 以 通过 这 种 方 


式 来 表示 中 文字 符 。 如 果 一 个 Unicode 字 符 不 在 基本 多 语言 平台 
(BMP) 中， 那么 要 在 Java 中 以 代理 项 对 的 方式 出 现 ， 在 转移 成 正则 
表达 式 中 使 用 ^\u” 形 式 的 时 候 ， 则 需要 两 个 相 邻 的 字符 。 这 样 既 不 够 直 
观 ， 使 用 起 来 也 不 方便 。Java7 对 正则 表达 式 新 增 了 “x” 来 直接 表示 


Unicode 中 的 代码 点 。“\x” 的 使 用 方式 与 ^u”* 类 似 ， 只 不 过 允许 表示 的 范 
围 更 广 ， 如 Unicode 代 码 点 U+1011F 可 以 直接 表示 成 ^\x1011F”。 


3. 新 标记 Pattern.UNICODE_CHARACTER_CLASS 

在 通过 Pattern 类 的 compile 方 法 对 正则 表达 式 进 行 编译 时 ， 可 以 指 
定 多 个 标记 。 这 些 标 记 可 以 控制 匹配 时 的 行为 。 常 见 的 标记 包括 设置 
匹配 时 不 区 分 大 小 写 的 Pattern.CASE_INSENSITIV， 以 及 设置 “.” 匹 配 包 
括 换 行 符 在 内 的 所 有 字符 的 Pattern.DOTALL。Java7 中 添加 了 一 个 额外 
的 标记 Pattern.UNICODE_CHARACTER_CLASSL 来 设置 使 用 Unicode 版 
本 的 预定 义 字 符 类 和 POSIX 字 符 类 。 以 “\d”* 这 个 预定 义 字 符 类 为 例 ， 在 
默认 情况 下 ， 只 会 匹配 Unicode 规 范 中 所 有 定义 的 所 有 属于 数字 类 别 的 
字符 ， 不 只 是 0 到 9 的 数字 ， 也 会 包括 其 他 语言 中 的 数字 字符 。 下 面 代 
PS, A (\d+) ”模式 来 匹配 字符 串 中 的 数字 。 示 例 中 输入 的 字符 
串 是 “100 1 0 0”， 其 中 包含 了 一 半 的 数字 “100” 和 全 角 数 字 “1 0 0”。 在 
两 个 Pattern 类 的 对 象 中 ， 第 一 个 Pattern 类 的 对 象 在 编译 时 没有 使 用 
UNICODE_CHARACTER_CLASS 标 记 ， 只 能 匹配 一 般 的 数字 “100”， 
而 第 二 个 Pattern 类 对 象 可 以 匹配 整个 字符 串 。 


代码 清单 3-148 Compile 方式 
public void useUnicodeCharacterClass () { 

String str = "100 1 0-0"; 

Pattern pattern = Pattern.compile("(\\dt)"); 

Matcher matcher = pattern.matcher (str) ; 

if (matcher. find()) { 
String digit = matcher.group(1); ///4À 100 
System.out.println (digit); 

} 

pattern = Pattern.compile("(\\d+)", Pattern. UNICODE CHARACTER CLASS); 

matcher = pattern.matcher (str) ; 

if (matcher. find()) { 
String digit = matcher.group(1);//44 100 1 0 0 
System.out.println (digit); 


} 


受到 UNICODE_CHARACHTER_CLASS 标 记 影 响 的 字符 类 除了 
«q"Z5^, YRBJfÉ' ^s". "ww". “\p{Lower}”, *p(Upper) "f ^p(Punct) 
等 。 

4. 指 定 Unicode 字 符 使 用 的 书写 格式 

Java7 中 另外 一 个 与 正则 表达 式 相 关 的 更 新 也 与 Unicode 相 关 。 在 
Java7 之 前 ， 正 则 表达 式 在 匹配 Unicode 字 符 串 时 允许 指定 Unicode 字 符 
所 在 的 区 块 和 类 别 ， 而 在 Java7 中 还 允许 指定 Unicode 字 符 使 用 的 书写 格 
式 (script) 。 在 指定 书写 格式 时 使 用 的 是 ^p”， 如 “pf{script=Han}” 的 
含义 是 匹配 字符 串 中 书写 格式 为 汉字 的 Unicode 字 符 。 在 匹配 时 可 以 使 
用 的 合法 书写 格式 名 称 都 定义 在 枚 举 类 型 CharacterUnicodeScript 中 。 


3.5.16 压缩 文件 处 理 


Java 标 准 库 中 的 java.util.zip 包 用 于 对 压缩 文件 进行 处 理 。Java7 对 这 
一 部 分 功能 的 更 新 也 比较 多 。 在 对 文件 进行 压缩 时 ， 人 允许 选择 压缩 时 


缓存 的 中 间 结 果 的 输出 方式 ， 这 体现 在 java.util.zip.Deflater 类 的 deflate 
方法 增加 了 一 个 参数 来 表示 不 同 的 输出 方式 。 默 认 的 方式 是 
DeflaterNO_FLUSH， 该 方式 由 压缩 者 来 确定 输出 缓存 的 中 间 结 果 的 有 具 
体 时 机 。 在 这 种 方式 下 ， 压 缩 者 可 以 自由 决定 缓存 中 数据 的 大 小 ， 
此 通常 可 以 获得 最 佳 的 性 能 。 第 二 种 输出 方式 是 
Deflater.SYNC_FLUSH， 这 种 方式 在 每 次 调用 defalte 方 法 时 自动 清空 
部 缓冲 区 ， 把 压缩 的 中 间 结 果 输 出 。 这 种 方式 的 好 处 在 于 ， 如 果 有 解 
压缩 程序 正在 等 待 压 缩 之 后 的 输出 结果 ， 及 时 地 清空 缓冲 区 可 以 让 解 
压缩 程序 更 早 地 开始 工作 ， 有 利于 提高 压缩 程序 的 工作 效率 。 不 过 这 
种 方式 会 对 压缩 性 能 产生 影响 。 最 后 一 种 输出 方式 是 
DeflaterFULL_FLUSH， 这 种 方式 除了 清空 缓冲 区 之 外 ， 同 时 还 重 置 压 
缩 者 的 内 部 状态 。 如 果 解 压缩 的 程序 发 现 压缩 的 结果 不 正确 ， 可 以 使 
用 此 方式 来 调用 deflate 方 法 ， 要 求 压缩 者 进行 压缩 操作 。 这 种 方式 对 性 
能 的 影响 更 大 ， 只 在 必要 时 才 使 用 。 

与 Deflater 类 对 应 的 java.util.zip.DeflaterOutputStream 类 的 对 象 在 创 
建 时 增加 了 一 个 参数 syncFlush， 用 来 表示 对 Deflater 类 的 对 象 所 缓存 的 
中 间 结 果 的 处 理 方式 。 如 果 syncFlush 的 值 为 tue， 那 么 在 调用 
DeflaterOutputStream 类 的 对 象 的 flush 方 式 来 清空 其 本 身 的 内 部 缓冲 区 之 
前 ， 会 先 按照 SYNC_FLUSH 的 方式 清空 对 应 的 DeFlater 类 的 对 象 所 缓存 
的 中 间 结果 。 

在 Java7 之 前 ， 压 缩 文 件 中 的 文件 名 和 注释 都 是 用 默认 编码 格式 
UTF-8。 这 种 UTF-8 格 式 可 能 造成 通过 Java 压 缩 的 文件 无 法 被 其 他 工具 
打开 。 为 了 解决 这 个 问题 ，Java7 允 许 在 创建 压缩 文件 时 显 式 地 指定 文 
件 名 和 注释 所 用 的 字符 集 。 这 体现 在 javautilzip.ZipFile 、 
java.util.zip.ZipInputStream Wl java.util.zip.ZipOutputStrean % AY 14] 3& 75 7& 
中 都 增加 了 一 个 java.nio.charset.Charset 类 的 对 象 作 为 参数 。 这 个 Charset 
类 的 对 象 就 表明 了 压缩 文件 中 文件 名 和 注释 所 用 的 编码 字符 集 。 通 过 
Java 产 生 的 压缩 文件 中 也 包含 了 相关 的 元 数据 ， 用 来 表示 压缩 时 的 文件 
名 和 注释 所 使 用 的 字符 集 。 

除了 上 面 这 些 比 较 大 的 改动 之 外 ， 还 有 一 些 相 关 的 小 改动 ， 包 
括 : Java7 支 持 大 于 4GB 的 压缩 文件 的 处 理 ; ZipFile 类 实现 了 
java.io.Closeable 接 口 ， 从 而 可 以 在 try-with-resources 语 句 中 使 用 ，; 
ZipFile 类 多 了 一 个 方法 getComment， 用 来 获取 在 创建 压缩 文件 时 通过 


ZipOutputStream 类 的 setComment 方 法 所 添加 的 文件 注释 ; 如 果 
java.util.zip.GZIPInputStream 类 在 处 理 压 缩 文 件 时 遇 到 了 格式 不 正确 的 
压缩 文件 ， 会 抛 出 更 加 具体 的 java.util.zip.ZipException 异 常 。 


在 集合 类 方面 ，java.util.Collections 类 增加 了 两 个 新 的 方法 
emptylterator 和 emptyEnumeration， 用 来 返回 空 的 迭代 器 对 象 和 列举 对 
象 。 


3.6 本 章 小 结 


本 章 首先 针对 面向 对 象 基础 、 基 础 类 型 概念 列举 了 一 些 优化 建议 
及 范例 代码 ， 然 后 对 集合 类 的 优化 方案 ， 特 别 是 Java8 的 一 些 新 特性 进 
行 了 解释 及 范例 代码 演示 。 接 下 来 ， 对 字符 串 操 作 的 优化 建议 及 实 
践 、 对 象 引 用 级 别 的 优化 及 实践 这 两 个 主题 进行 深入 解释 。 最 后 ， 演 
示 了 其 他 一 些 方面 的 优化 方案 。 由 于 篇 幅 所 限 ， 不 能 列举 所 有 的 优化 
方案 及 实践 经 验 ， 请 读者 见谅 。 
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[4]String 不 可 变 的 原因 包括 设计 考虑 、 效 率 优化 问题 ， 以 及 安全 性 这 三 大 方面 。 


[5] «Design Patterns: Elements of Reusable Object-Oriented Software) , FA Erich Gamma, Richard Helm, Ralph 
Johnson 和 John Vlissides 合 著 (Addison-Wesley, 1995) 。 这 几 位 作者 常 被 称 为 “四 人 组 (Gang of Four) ”。 

[6] 数据 挖掘 (英语 : Data Mining) ， 又 译 为 资料 探勘 、 数 据 采 矿 。 它 是 数据 库 知识 发 现 (英语 : Knowledge-Discovery 
in Databases， 简 称 : KDD) 中 的 一 个 步 又。 数据 挖掘 一 般 是 指 从 大 量 的 数据 中 通过 算法 搜索 隐藏 于 其 中 信息 的 过 程 。 数 
据 挖 据 通 常 与 计算 机 科学 有 关 ， 并 通过 统计 、 在 线 分 析 处 理 、 情 报 检索 、 机 器 学 习 、 专 家 系统 (依靠 过 去 的 经 验 法 则 ) 
和 模式 识别 等 诸多 方法 来 实现 上 述 目标 。 

[7] 即 设计 模式 中 提 到 的 单一 职责 。 

[8] 流 代表 从 支持 聚合 操作 源 的 序列 的 对 象 。 

[9] 一 种 基于 Linux 的 自由 及 开放 源 代码 的 操作 系统 ， 主 要 使 用 于 移动 设备 ， 如 智能 手机 和 平板 电脑 ， 由 Google 公 司 和 开放 
手机 联盟 领导 及 开发 。 

[10] Avian 是 一 个 轻 量 级 的 Java 虚拟 机 和 类 库 ， 提 供 了 Java 特 性 的 一 个 有 用 的 子 集 ， 适 合 开发 跨 平 台 、 自 包容 的 应 用 程 
序 。 

[11] RoboVM 编 译 器 可 以 将 Java 字 节 码 翻译 成 ARM[ 或 者 x86 平 台 上 的 原生 代码 ， 应 用 可 直接 在 CPU 上 运行 ， 无 须 其 他 解释 
器 或 者 虚拟 机 。RoboVM 同 时 包含 一 个 Java 到 Objective-C 的 桥 ， 可 像 其 他 Java 对 象 一 样 来 使 用 Objective-C 对 象 。 大 多 数 
UIKit 已 经 支持 ， 而 且 将 会 支持 更 多 的 框架 。 


第 4 章 程序 设计 优化 建议 


齐 使 者 如 梁 ， 孙 逐 以 刑 徒 阴 见 ， 说 齐 使 。 齐 使 以 为 奇 ， 窃 载 与 之 
齐 。 齐 将 田鼠 善 而 客 待 之 。 鼠 数 与 齐 诸 公 子 驰 逐 重 射 。 孙 子 见 其 马 足 
不 甚 相 远 ， 马 有 上 、 中 、 下 辈 。 于 是 孙子 谓 田 忌日 :“ 君 弟 重 射 ， 臣 能 
令 君 胜 。” 田 尽 信和 然 之 ,与 王 及 诸 公 子 逐 射 千 金 。 及 临 质 ， 孙 子 日 : 
“SUEZ RUE: LEY, BE EUER, RERS FM. ” 
Etz, MASTS, SETS. FERS 
王 。 威 王 问 兵法 ， 遂 以 为 师 。 这 正 是 历史 上 很 有 名 的 “ 田 尽 赛马 ” 典 
故 。 

任务 程序 都 不 可 能 与 设计 方案 、 业 务 逻 辑 完全 无 关 ， 只 要 你 的 程 
序 代码 需要 涉及 业务 逻辑 知识 ， 你 就 需要 采用 较 好 的 设计 方法 ， 否 则 
性 能 就 会 下 降 。 这 也 正和 田鼠 赛马 一 样 ， 我 们 要 会 取舍 ， 会 扬长 避 
短 ， 会 吸取 他 人 的 优点 ， 这 样 我 们 的 程序 才能 在 软件 设计 上 达到 最 优 
化 境界 。 

本 章 主 要 介绍 和 解决 以 下 问题 ， 程 序 设计 过 程 涉及 整个 软件 的 性 
BE: 

n 什么 是 算法 优化 建议 。 

m 如 何 更 好 地 利用 设计 模式 。 

m 如 何 使 用 Java 网 络 包 、 如 何 操作 数据 库 。 

m 如 何 解 决 海量 数据 处 理 、 存 储 问题 。 

m 如 何 更 好 地 对 程序 逻辑 进行 优化 、 避 免 出 现 问题 。 

u 关于 Web 系 统 的 优化 建议 。 


4.1 算法 优化 概述 


对 应 用 程序 进行 性 能 调 优 所 能 获得 的 最 大 收益 往往 来 目 于 算法 效 
率 的 提高 。 高 效 的 算法 让 应 用 程序 使 用 更 少 的 CPU 指令 、 更 短 的 执行 
路 径 实现 程序 功能 ， 也 融 是 说 ， 通 常情 况 下 拥有 更 短 执行 路 径 的 应 用 
程序 运行 得 更 快 。 缩 短 执行 路 径 的 长 度 有 很 多 种 方法 ,例如 从 应 用 程 


序 的 最 高 层 来 看 ， 使 用 更 优 的 数据 结构 或 者 改进 算法 往往 可 以 构造 出 
更 短 的 执行 路 径 。 很 多 应 用 程序 的 性 能 问题 都 源 于 使 用 了 不 合适 的 数 
据 结构 ， 使 用 恰当 的 数据 结构 及 算法 是 提升 程序 性 能 最 有 效 的 方法 。 
因此 ， 性 能 分 析 过 程 中 ， 要 充分 注意 程序 使 用 的 数据 结构 及 算法 ， 尽 
可 能 采用 更 优 的 方式 ， 才 能 最 大 限度 地 提高 程序 性 能 。 


4.1.1 常用 算法 逻辑 描述 


我 们 日 常 编写 程序 时 容易 接触 到 的 算法 ， 包 括 先进 先 出 算法 、 最 
近 最 少 使 用 算法 、 最 近 最 多 使 用 算法 等 ，JDK 中 许多 数据 结构 类 的 设 
计 、 缓 存 的 实现 都 必须 基于 这 些 算 法 模型 ， 才 能 让 应 用 软件 开发 人 员 
可 以 根据 自己 的 软件 业务 逻辑 选择 合适 的 中 间 件 或 者 数据 结构 。 
4.1.1.1 FIFO 算 法 


FIFO (First in First out) ， 即 先进 先 出 算法 ， 比 如 在 超市 购物 之 后 
会 提 着 我 们 满 满 的 购物 车 来 到 收银 台 排 在 结账 队伍 的 最 后 ， 眼 睁 睁 地 
看 着 前 面 的 客户 一 个 个 离开 ， 这 就 是 一 种 先进 先 出 机 制 ， 先 排队 的 客 
户 先 行 结账 离开 。 其 实在 操作 系统 的 设计 理念 中 很 多 地 方 都 利用 到 了 
先进 先 出 的 思想 ， 比 如 作业 调度 机 制 ， 采 用 先 来 先 服务 的 原则 ， 为 什 
么 这 个 原则 在 很 多 地 方 都 会 用 到 呢 ? 因为 这 个 原则 简单 ， 符 合 人 们 的 
惯性 思维 ， 具 备 公 平 性 ， 并 且 实 现 起 来 简单 ， 通 过 直接 使 用 数据 结构 
中 的 队列 即 可 实现 。 

FIFO 是 队列 机 制 中 最 简单 的 ， 每 个 接口 上 都 存在 FIFO 队 列 ， 表 面 
上 看 FIFO 队 列 并 没有 提供 什么 QoS (Quality of Service， 服 务 质量 ) R 
证 ， 甚 至 很 多 人 认为 FIFO 严 格 意义 上 不 算 做 一 种 队列 技术 ， 实 则 不 
然 ，FIFO 是 其 他 队列 的 基础 ，FIFO 也 会 影响 到 衡量 QoS 的 关键 指标 : 
报 文 的 丢弃 、 延 时 、 拌 动 。 有 既然 只 有 一 个 队列 ， 自 然 不 需要 考虑 如 何 
对 报 文 进行 复杂 的 流量 分 类 ， 也 不 用 考虑 下 一 个 报 文 怎么 拿 、 拿 多 少 
的 问题 ， 而 且 因 为 按 顺序 取 报 文 ，FIFO 无 须 对 报 文 重 新 排序 。 简 化 了 
这 些 实现 其 实 也 就 提高 了 对 报 文 时 延 的 保证 。 

在 FIFO Cache 设 计 中 ， 核 心 原 则 就 是 ， 如 果 一 个 数据 最 先进 入 组 
存 中 ， 则 应 该 最 早 被 淘汰 。 也 就 是 说 ， 当 缓存 满 的 时 候 ， 应 当 把 最 先 
进入 缓存 的 数据 给 淘汰 掉 。 在 设计 一 个 基于 FIFO 算 法 的 Cache (RF) 
组 件 时 应 该 支持 以 下 操作 。 


m get (key) : 如 果 Cache 中 存在 该 key， 则 返回 对 应 的 value 值 ， 否 
则 ， 返 回 -1。 

mset (key, value) : 如 果 Cache 中 存在 该 key， 则 重 置 value 值 ; 如 
果 不 存 在 该 key， 则 将 该 key 插 入 到 到 Cache 中 ， 若 Cache 已 满 ， 则 淘汰 最 
早 进入 Cache 的 数据 。 

举 个 例子 ， 假 如 Cache 大 小 为 3， 访 问 数据 序列 为 st (1, 1) 、set 
(2, 2) 、set (3, 3) ~ set (4, 4) 、get (2) 、set (5, 5) 则 Cache 
中 的 数据 变化 如 代码 清单 4-1 所 示 。 


代码 清单 4-{ Cache 中 的 数据 变化 


(1,1) set (1,1) 

(1,1) (2,2) set (2,2) 

(1,1 2) (3,3) set (3,3) 
(2,2 13) (4,4) set (4,4) 
(2,2 3) (4,4) get (2) 
(3,3 4) (5,5) set(5,5) 


那么 利用 什么 数据 结构 来 这 样 的 实现 呢 ? 我 们 可 以 利用 一 个 双向 
链表 保存 数据 ， 当 来 了 新 的 数据 之 后 便 添 加 到 链表 末尾 ， 如 果 Cache 
存 满 数 据 ， 则 把 链表 头 部 数据 删除 ， 然 后 把 新 的 数据 添加 到 链表 末 
尾 。 在 访问 数据 的 时 候 ， 如 果 在 Cache 中 存在 该 数据 的 话 ， 则 返回 对 应 
的 value 值 ， 否 则 返回 -1。 如 果 想 提高 访问 效率 ， 可 以 利用 HashMap[1] 
来 保存 每 个 key 在 链表 中 对 应 的 位 置 。 

加 现 JDK 自 带 顺 序 保存 ， 代 码 如 代码 的 LinkedHa 我 们 只 需 重 清单 4- 
2 所 示 shMap 类 是 基 写 下 removeE。 于 FIFO 实 ldestEntry 方 现 的 ， 默 认 情 
法 即 可 轻松 况 下 Linke 实 现 一 个 FI dHashMap 就 FO 缓 存 ， 简 是 按照 添 化 
版 的 实 


代码 清单 4-2 LinkedHashMap BY) FIFO 实现 

final int cacheSize = 5; 

LinkedHashMap<Integer, String> lru = new LinkedHashMap<Integer, String>() { 
@Override 
protected boolean removeEldestEntry (Map.Entry<Integer, String> eldest) { 
return size() > cacheSize; 
} 

}; 


限 单 文 填 会 文 FIFO 关 心 的 ， 有 可 能 地 说 就 是 该 可 以 挤 掉 已 满 ， 被 
丢弃 导致 抖动 也 就 变 多 了 。 的 就 是 队列 被 填 满 ， 这 就 队列 如 果 已 经 在 
队列 内 的 报 文 也 就 增加 。 如 果 长 度 问 题 ， 涉 及 该 机 制 经 满 了 ， 那 么 的 
报 文 。 在 这 少 了 ， 但 是 队 定义 了 较 短 的 队列 长 度 会 影 的 丢弃 原则 后 续 
进入 的 种 机 制 中 ， 列 长 度 太 长 队列 ， 时 延 响 到 时 延 、。 常 见 的 一 个 报 
文 被 丢弃 如 果 定 义 了 了 会 出 现时 的 问题 可 以 得 抖动 、 丢 包 率 丢弃 原则 
叫 ， 而 没有 什么 较 长 的 队列 长 延 的 问题 ， 一 到 解决 ， 但 。 因 为 队列 作 
Tail Drop 机 制 来 保证 度 ， 那 么 队 般 情况 下 时 是 发 生 Tail 长 度 是 有 机 制 。 
简 后 续 的 报 列 不 容易 延 的 增加 Drop 的 报 

4.1.1.2 LFU 算 法 

法 次 很 数 算 需 LFU (Le。 它 是 基于 数 很 少 ， 那 小 ”的 思路 据 的 访问 
记 法 需要 记录 要 基于 引用 ast Frequentl“ 如 果 一 个 么 在 将 来 一 。LFU 算 法 
录 ， 每 个 数据 所 有 数据 的 计数 排序 ，y Used) ， 即 最 数据 在 最 近 一 段 时 
间 内 被 使 需要 维护 一 个 都 需要 维护 访问 记录 ， 内 性 能 消耗 较 高 近 最 多 
使 用 段 时 间 内 使 用 的 可 能 性 队列 记录 所 引用 计数 。L 存 消耗 较 高 。 算 用 
也 有 FU; 

块 按 LFU 的 每 按照 引用 计 照 时 间 排 序 个 数据 块 都 数 排序 ， 具 。 具 
体 实现 有 一 个 引用 计 有 相同 引用 计 如 图 4-1 所 示 数 ， 所 有 数 数 的 数据 
块 。 据 则 

如 图 4-1 所 示 的 操作 包括 : 


LFU 队 列 


20 


15 | 按照 引用 次 数 排序 


2. 重 新 排序 


D 相同 引用 次 数 按照 时 间 


1. 新 加 入 数据 
3. 淘 汰 数据 


图 4-1 LFU 算 法 实现 

(1) 新 加 为 入 数据 插入 1) ; 到 队列 尾部 (因为 引用 计数 

(2) 队列 中 的 数据 被 访问 后 ， 引 用 计数 增加 ， 队 列 重 新 排序 ; 

(3) 当 需 要 淘汰 数据 时 ， 将 已 经 排序 的 列表 最 后 的 数据 块 删除 。 

注意 LFU 和 下 一 小 节 要 介绍 的 LRU 算 法 之 间 存 在 的 不 同 之 处 ， 
LRU 的 淘汰 规则 是 基于 访问 时 间 ， 而 LFU 是 基于 访问 次 数 的 。 举 个 简 
单 的 例子 ， 假 设 缓存 大 小 为 3， 数 据 访问 序列 为 set (2, 2) 、set (1, 
1) 、get (2) 、get (1) 、get (2) 、set (3, 3) ~ set (4, 4) , MI 
在 set (4, 4) 时 对 于 LFU 算 法 应 该 淘汰 (3, 3) ， 而 LRU 应 该 淘汰 
(1，1) 。LRU 关 键 是 看 页 面 最 后 一 次 被 使 用 到 发 生 调 度 的 时 间 长 
短 ， 而 LFU 关 键 是 看 一 定时 间 段 内 页 面 被 使 用 的 频率 。 

那么 基于 LFU 算 法 的 Cache 设 计 应 该 支持 的 操作 如 。 

m get (key) : 如 果 Cache 中 存在 该 key， 则 返回 对 应 的 value 值 ， 否 
则 ， 返 回 -1; 

mset (key, value) : 如 果 Cache 中 存在 该 key， 则 重 置 value 值 ; 如 
果 不 存在 该 key， 则 将 该 key 插 入 到 到 Cache 中 ， 若 Cache 已 满 ， 则 淘汰 最 
少 访问 的 数据 。 


为 了 能 够 淘 状 最 少 使 用 的 数据 ，LFU 算 法 最 简单 的 一 种 设计 思 
就 是 利用 一 个 数组 存储 数据 项 ， 用 HashMap 存 储 每 个 数据 项 在 数组 中 
对 应 的 位 置 ， 然 后 为 每 个 数据 项 设计 一 个 访问 频次 ， 当 数据 项 被 命 
时 ， 访 问 频 次 自 增 ， 在 淘 状 的 时 候 淘 状 访问 频次 最 少 的 数据 。 这 样 一 
来 的 话 ， 在 插入 数据 和 访问 数据 的 时 候 都 能 达到 O (1) 的 时 间 复 杂 
度 ， 在 淘 状 数据 的 时 候 ， 通 过 选择 算法 得 到 应 该 淘 关 的 数据 项 在 数组 
中 的 索引 ， 并 将 该 索引 位 置 的 内 容 蔡 换 为 新 来 的 数据 内 容 即 可 ， 这 样 
的 话 ， 淘 状 数据 的 操作 时 间 复 杂 度 为 O (n o 

另外 还 有 一 种 实现 思路 就 是 利用 最 小 堆 和 HashMap 两 者 的 优势 ， 
最 小 堆 中 根 结 点 的 键 值 是 所 有 堆 结 点 键 值 中 的 最 小 者 。 最 小 堆 插 入 、 
删除 操作 都 能 达到 O (logn) 时 间 复 杂 度 ， 因 此 效率 相 比 第 一 种 实现 方 
法 更 加 高 效 。 代 码 清单 4-3 所 示 的 代码 是 最 小 堆 实 现 的 一 个 示例 。 


代码 清单 4-3 最 小 堆 实现 示例 
public class SmallHeapDemo { 
final static int MAX LEN = 100; 
private int queue[] = new int[MAX LEN]; 


private int size; 


public void add(int e) { 
if(size »- MAX LEN) 


{ 


System.err.println ("over flow"); 
return; 


} 
int s = sizett; 


shiftup(s,e); 


public int size() { 


return size; 


private void shiftup(int s, int e) { 


while(s > 0) { 
int parent = (s - 1)/2; 


if (queue [parent] < e){ 
break; 

} 

queue[s] = 

s = parent; 


} 


queue [s] = e; 


public int polli)t 
if(size <= 0) 

return —1; 

int ret = queue[0]; 


int s = --size; 
shiftdown(0, queue[s]); 
queue[s] = O; 


return ret; 


private void shiftdown(int i, 


int half = size /2; 
while(i < half ){ 
int ehsibd 2-31 +1¢ 
int right = child *1; 


queue [parent]; 


int e) 


if(right < size && queue[child] 


child = right; 

} 

if(e < queuve[child]) { 
break; 

} 

queue[i] = 

Ehi Ld; 


i = 
} 


queue[i] = e 


` 


queue[child]; 


{ 


> queue[right]){ 


public static void main(String argsLl»ít 


SmallHeapDemo hs = 
hs.add(4); 
hs.add(3); 
hs.add(7); 
hs.add(2); 
int size = hs.size(); 


for (int i=0; I< size; 


i++) { 


System.out.println(hs.poll()); 


new SmallHeapDemo () ; 


| 

程序 运行 输出 为 “2347”。 

一 般 情况 下 ，LFU 效 率 要 优 于 LRU， 且 能 够 避免 周期 性 或 者 偶发 
性 的 操作 导致 缓存 命中 率 下 降 的 问题 。 但 LFU 需 要 记录 数据 的 历史 访 
问 记 录 ， 一 旦 数据 访问 模式 改变 ，LFU 需 要 更 长 时 间 来 适用 新 的 访问 
模式 ， 即 LFU 存 在 历史 数据 影响 将 来 数据 的 “缓存 污染 ”效用 。 

4.1.1.3 LRU 算 法 


LRU 是 Least Recently Used 的 缩写 ， 即 “最 近 最 少 使 用 *， 基 于 LRU 
算法 实现 的 Cache 机 制 简单 地 说 就 是 缓存 一 定量 的 数据 ， 当 超过 设 定 的 
阅 值 时 就 把 一 些 过 期 的 数据 删除 挤 ， 比 如 我 们 缓存 10000 条 数据 ， 当 数 
据 小 于 10000 时 可 以 随意 添加 ， 当 超过 10000 时 就 需要 把 新 的 数据 添加 
进来 ， 同 时 要 把 过 期 数据 删除 ， 以 确保 我 们 最 大 缓存 10000 条 ， 那 怎么 
确定 删除 哪 条 过 期 数据 呢 ， 采 用 LRU 算 法 实现 就 是 将 最 老 的 数据 删 
Ro Java 里 面 实 现 LRU 缓 存 通常 有 两 种 选择 ， 一 种 是 使 用 
LinkedHashMap ， 一 种 是 自己 设计 数据 结构 ， 使 用 链表 +HashMap 方 
Tho 

LinkedHashMap 自 身 已 经 实现 了 顺序 存储 ， 默 认 情 况 下 是 按照 元 素 
的 添加 顺序 存储 ， 也 可 以 启用 按照 访问 顺序 存储 ， 即 最 近 读 取 的 数据 
放 在 最 前 面 ， 最 早 读 取 的 数据 放 在 最 后 面 ， 然 后 它 还 有 一 个 判断 是 否 
删除 最 老 数据 的 方法 ， 默 认 是 返回 false， 即 不 删除 数据 。 

代码 清单 4-4 所 示 示 例 是 LinkedHashMap 的 一 个 构造 图 数 ， 当 参数 
accessOrder 为 true 时 ， 将 会 按照 访问 顺序 排序 ， 最 后 访问 的 放 在 最 前 ， 
最 早 访问 的 放 在 后 面 。 


代码 清单 4.4 LRU Cache 的 LinkedHashMap 实现 
public LinkedHashMap (int initialCapacity, float loadFactor, boolean accessOrder) { 
super(initialCapacity, loadFactor); 
this.accessOrder - accessOrder; 
} 
代码 清单 4-5 所 示 赛 马 是 LinkedHashMap 自 带 的 判断 方法 ， 判 断 是 
否 删除 最 老 的 元 素 方 法 ， 默 认 返 回 false， 即 不 删除 老 数 据 ， 我 们 要 做 


的 就 是 重 写 这 个 方法 ， 当 满足 一 定 条 件 时 删除 老 数据 。 


代码 清单 4-.5 重 写 删 除 方法 
protected boolean removeEldestEntry (Map.Entry«K,V» eldest) { 
return false; 


} 


采用 inheritance 方 式 实 现 比 较 简 单 ， 该 方式 实现 了 Map 接 口 ， 在 多 
线程 环境 使 用 时 可 以 使 用 Collections.synchronizedMap () 方法 实现 线 
程 安全 操作 。 


代码 清单 4-6 LRU 缓存 LinkedHashMap(inheritance) 实 现 
import java.util.LinkedHashMap; 


import java.util.Map; 


public class LRUCache2<K, V> extends LinkedHashMap«K, V> { 
private final int MAX CACHE SIZE; 


public LRUCache2(int cacheSize) { 
super((int) Math.ceil(cacheSize / 0.75) * 1, 0.75f, true); 
MAX CACHE SIZE - cacheSize; 


@Override 
protected boolean removeEldestEntry(Map.Entry eldest) { 
return size() > MAX CACHE SIZE; 


@Override 
public String toString() { 
StringBuilder sb = new StringBuilder (); 
for (Map.Entry«K, V» entry : entrySet()) | 
sb.append(String.format("$s:$s ", entry.getKey(), entry.getValue())); 
} 


return sb.toString(); 


} 
代码 清单 4-6 的 实现 是 比较 标准 的 实现 ， 在 实际 使 用 过 程 中 这 样 写 


还 是 有 些 烦 琐 ， 更 实用 的 方法 是 像 代码 清单 4-7 这 样 写 ， 省 去 了 单独 新 
建 一 个 类 的 麻烦 。 


代码 清单 4-7 LRU 缓存 LinkedHashMap(inheritance) 实 现 改进 版 
final int cacheSize = 100; 
Map<String, String> map = new  LinkedHashMap<String, String>((int) 
Math.ceil(cacheSize / 0.75f) + 1, 0.75f, true) { 
@Override 
protected boolean removeEldestEntry (Map.Entry<String, String> eldest) { 
return size() > cacheSize; 
} 
H 


相 比 inheritance 实 现 方 式 来 说 ，delegation 实 现 方 式 实现 更 加 优雅 一 
些 ， 但 是 由 于 没有 实现 Map 接 口 ， 所 以 线程 同步 就 需要 自己 搞定 了 。 


代码 清单 4-8 LRU 缓存 LinkedHashMap(delegatiom) 实 现 
import java.util.LinkedHashMap; 
import java.util.Map; 


import java.util.Set; 


[** 
* Created by liuzhao on 14-5-13. 
| 

public class LRÜCache3«K, V> { 


private final int MAX CACHE SIZE; 


private final float DEFAULT LOAD FACTOR = 0.75f; 
LinkedHashMap«K, V» map; 


public LRUCache3(int cacheSize) { 
MAX CACHE SIZE = cacheSize; 
// 根 据 cacheSize 和 加 载 因子 计算 hashmap 的 capactiy, +1 确保 当 达 到 cacheSize 上 限时 
不 会 触发 hashmap 的 扩容 

int capacity = (int) Math.ceil (MAX CACHE SIZE / DEFAULT LOAD FACTOR) + 1; 
map = new LinkedHashMap (capacity, DEFAULT LOAD FACTOR, true) { 

@Override 

protected boolean removeEldestEntry(Map.Entry eldest) { 

return size() > MAX CACHE SIZE; 


public synchronized void put(K key, V value) { 
map.put(key, value); 


public synchronized V get(K key) { 
return map.get (key) ; 


public synchronized void remove(K key) { 


map. remove (key); 


public synchronized Set<Map.Entry<K, V>> getAll() ( 


return map.entrySet(); 


public synchronized int size() { 


return map.size(); 


public synchronized void clear() { 


map.clear(); 


@Override 
public String toString() { 
StringBuilder sb = new StringBuilder (); 
for (Map.Entry entry : map.entrySet()) { 
sb.append(String.format("$s:$s ", entry.getKey(), entry.getValue())); 
} 


return sb.toString(); 


} 
注意 ， 上 面 的 实现 方式 是 非 线 程 安全 的 ， 若 在 多 线程 环境 下 使 用 
需要 在 相关 方法 上 添加 synchronized 以 实现 线程 安全 操作 。 


前 面 说 过 ， 除 了 LinkedHashMap 方 式 以 外 ， 我 们 还 有 一 种 采用 LRU 
Cache 的 链表 +HashMap 实 现 的 方式 ， 如 代码 清单 4-9 包 含 的 代码 所 示 。 


代码 清单 4-9 LRU Cache 的 链表 +HashMap 实现 
import java.util.HashMap; 
public class LRUCachel«K, V» { 


private final int MAX CACHE SIZE; 
private Entry first; 
private Entry last; 


private HashMap«K, Entry«K, V»» hashMap; 


public LRUCachel(int cacheSize) { 
MAX CACHE SIZE - cacheSize; 
hashMap = new HashMap<K, Entry«K, V>>(); 


public void put(K key, V value) ( 
Entry entry = getEntry(key); 
if (entry == null) { 
if (hashMap.size() >= MAX CACHE SIZE) { 
hashMap.remove (last.key); 
removeLast (); 
) 
entry = new Entry(); 
entry.key = key; 
} 
entry.value = value; 
moveToFirst (entry); 


hashMap.put(key, entry); 


public V get(K key) { 
Entry«K, V» entry = getEntry(key); 
if (entry == null) return null; 
moveToFirst (entry); 


return entry.value; 


public void remove(K key) { 
Entry entry = getEntry(key); 
if (entry != null) { 


if (entry.pre != null) 

if (entry.next != null) 

if (entry == first) first = 
if (entry == last) last = 


} 


hashMap. remove (key) ; 


private void moveToFirst (Entry entry) 


entry.pre.next = 


entry.next.pre = 


{ 


entry .next; 


entry.pre; 


entry.next; 


entry.pre; 


= entry.next; 


if (entry == first) return; 
if (entry.pre != null) entry.pre.next 
if (entry.next != null) entry.next.pre = 
if (entry == last) last = last.pre; 
if (first == null || last == null) { 
first = last = entry; 
return; 
} 
entry.next = first; 
first.pre = entry; 
first = entry; 
entry.pre = null; 
} 
private void removeLast() { 
if (last != null) { 
last = last.pre; 
if (last == null) first = null; 
else last.next = null; 


private Entry<K, V> getEntry(K key) { 


return hashMap.get (key) ; 


@Override 

public String toString() ít 
StringBuilder sb = 

first; 

!— null) { 


sb.append(String.format ("%s:%s 


Entry entry = 
while (entry 
entry = entry.next; 


} 
return sb.toString(); 


, 


new StringBuilder(); 


entry.key, 


entry.pre; 


entry.value)); 


class Entry<K, V> { 
public Entry pre; 
public Entry next; 
public K key; 


public V value; 


} 


4.1.2 多 核算 法 优化 原理 


4.1.2.1 锁 机 制 设计 简 述 
多 核算 法 优化 的 目标 大 致 有 两 种 ， 即 lock-free 和 1lock-less。lock-free 
是 完全 无 锁 的 设计 ， 有 具体 有 两 种 实现 方式 。 

(1) Per-Cpu Data， 顾 名 思 义 ， 每 个 核 或 者 线程 都 有 自己 私有 的 
数据 结构 ， 这 里 的 私有 是 逻辑 上 私有 ， 并 不 意味 着 别 的 线程 无 法 访问 
这 些 数 据 ， 而 thread local data 是 线程 私有 的 数据 结构 ， 别 的 线程 是 无 法 
访问 的 。 当 然 ， 不 管 是 逻辑 上 私有 ， 还 是 物理 上 私有 ， 把 共享 数据 转 
化 成 线程 私有 数据 就 可 以 避免 使 用 锁 ， 进 而 避免 竞争 。 全 局 变量 是 共 
享 的 ， 而 局 部 变量 是 私有 的 ， 所 以 多 使 用 局 部 变量 ， 同 样 可 以 达到 无 
锁 的 目的 。 

(2) CAS based，CAS 的 全 称 是 Compare And Swap, ， 属 于 一 个 原 
子 操作 。 自 旋 锁 (Spinlock) 是 专 为 防止 多 处 理 器 并 发 而 引入 的 一 种 
锁 ， 有 具体 我 们 会 在 第 5 章节 介绍 。 自 旋 锁 的 实现 同样 需要 Compare And 
Swap 方 式 ， 但 区 别 是 自 旋 锁 只 有 两 个 状态 LOCKED 和 UNLOCKED， 而 
CAS 的 变量 可 以 有 多 个 状态 。 其 次 ，CAS 的 实现 必须 由 硬件 来 保障 其 
原子 操作 的 实现 ，CAS 一 次 可 以 操作 32bits， 即 一 次 可 以 比较 、 修 改 一 
块 内 存 。 基 于 CAS 实 现 的 数据 结构 没有 一 个 统一 、 一 致 的 实现 方法 ， 
所 以 有 时 不 如 基于 锁 的 算法 那么 简单 、 直 接 。 针 对 不 同 的 数据 结构 有 
不 同 的 CAS 实 现 方法 ， 这 里 不 多 做 介绍 ， 读 者 可 以 找 分 布 式 方面 的 书 
籍 进一步 了 解 。 


lock-less 的 目的 是 减少 锁 的 争 用 (contention) ， 而 不 是 减少 锁 的 使 
用 。 这 个 和 锁 的 粒度 (granularity) 相关 ， 锁 的 粒度 越 小 ， 等 待 的 时 间 
就 越 短 ， 并 发 的 时 间 就 越 长 。 锁 的 争 用 需要 考虑 不 同 线程 在 获取 锁 
后 ， 会 执行 哪些 不 同 的 动作 。 以 资产 池 的 分 配 和 释放 管理 为 例 ， 假 设 
多 个 线程 都 会 访问 同一 个 资源 地 ， 分 配 或 者 释放 这 些 线程 需要 占有 的 
资源 。 资 源 池 可 以 是 一 个 双向 链表 ， 分 配 在 头 部 进行 ， 而 释放 在 尾部 
进行 。 如 果 多 个 线程 同时 访问 资源 地 ， 需 要 一 个 自 旋 锁 来 保护 这 个 资 
源 闻 。 那 么 分 配 和 释放 两 个 不 同 的 动作 ， 相 互 之 间 就 会 有 争 用 ， 而 且 
多 个 线程 上 的 分 配 ， 或 者 释放 本 身 也 存在 锁 争 用 。 

正如 前 一 段 描述 的 ， 我 们 可 以 考虑 分 配 用 一 个 锁 ， 释 放 用 一 个 
锁 ， 生 成 一 个 双 端 队列 ， 这 样 可 以 减少 分 配 和 释放 之 间 的 争 用 。 也 可 
以 考虑 采用 两 个 资源 地 ， 分 配 请 求 占 据 一 个 资产 地 ， 释 放 请 求 占 据 一 
个 资源 地 ， 那 么 当 分 配 资源 地 所 有 的 资源 用 完 之 后 ， 交 换 两 个 资源 池 
的 指针 ， 这 时 要 考虑 两 个 资源 闻 都 是 空 的 情况 ， 注 意 这 里 只 是 减少 了 
分 配 和 释放 的 争 用 ， 不 能 完全 消除 这 类 争 用 情况 的 发 生 。 

不 管 是 lock-based 还 是 CAS-based (lock-free) 的 数据 结构 ， 都 需要 
一 个 状态 位 来 统一 标识 。 即 让 程序 在 不 同 状 态 下 做 不 同 的 事 ， 而 增 大 
锁 的 粒度 ， 也 就 是 增加 了 资源 池 的 数量 ， 减 小 了 状态 保护 的 范围 。 

4.1.2.2 多 线程 简 述 

线程 是 一 个 程序 内 部 的 顺序 控制 流 ， 一 个 进程 相当 于 一 个 任务 ， 
一 个 线程 相当 于 一 个 任务 中 的 一 条 执行 路 径 。Java 程 序 需要 最 大 化 地 运 
用 多 核能 力 ， 如 果 使 用 多 线程 方式 ， 只 有 运行 的 线程 数 比 核 数 大 ， 才 
有 可 能 榨 干 CPU 资 源 ， 否 则 会 有 若干 核 闲 置 。 需 要 注意 的 是 ， 如 果 线 
程 数目 太 多 ， 就 会 占用 过 多 内 存 ， 导 致 性 能 不 升 反 降 。 此 外 ，JVM 的 
垃圾 回收 也 是 需要 线程 的 ， 所 以 这 里 的 线程 数 包 含 JVM 自 己 的 线程 。 
每 个 线程 有 自己 的 工作 内 存 ， 在 这 个 区 域内 ， 系 统 可 以 毫 无 顾忌 的 优 
化 ， 如 果 去 读 共 享 内 存 区 域 ， 性 能 也 不 会 下 降 。 但 是 一 旦 线程 想 写 共 
BAG (使 用 volatile 关 键 字 ) ， 就 会 插入 很 多 内 存 屏障 操作 (Memory 
Barrier 或 者 Memory Fence) 指令 ， 保 证 处 理 器 不 乱 序 执行 。 相 比 写本 
地 线程 自 有 的 变量 ， 性 能 下 降 很 多 。 处 理 方法 是 尽量 减少 共享 数据 ， 
这 样 也 符合 “数据 耦合 ”的 设计 原则 。 在 Javal1.5 中 ，Synchronize 是 性 能 
低 效 的 。 因 为 这 是 一 个 重量 级 操作 ， 需 要 调用 操作 接口 ， 导 致 有 可 能 


加 锁 消 耗 的 系统 时 间 比 加 锁 以 外 的 操作 还 多 。 相 比 之 下 使 用 Java 提 供 的 
Lock 对 象 性 能 更 高 一 些 。 但 是 Javal1.6 发 生 了 变化 。Synchronize 在 语义 
上 很 清晰 ， 可 以 进行 很 多 优化 ， 有 适应 自 旋 、 锁 消除 、 锁 粗 化 、 轻 量 
级 锁 、 偏 向 锁 等 。 导致 在 Javal.6 上 Synchronize 的 性 能 并 不 比 Lock 差 。 
这 些 相关 知识 会 在 第 5 章 详细 讲解 。 

4.1.2.3 NUMA 架 构 

在 NUMA 架 构 出 现 前 ，CPU 欢 快 地 朝 着 频率 越 来 越 高 的 方向 发 
展 。 受 到 物理 极限 的 挑战 ， 又 转 为 核 数 越 来 越 多 的 方向 发 展 。 如 果 每 
个 核心 的 工作 性 质 都 是 share-nothing (类 似 于 Map-Reduce 的 各 个 节点 的 
作业 属性 ) ， 那 么 也 许 就 不 会 有 NUMA。 由 于 所 有 CPU 核 都 是 通过 共 
享 一 个 北桥 来 读 取 内 存 ， 随 着 核 数 如 何 的 发 展 ， 北 桥 在 响应 时 间 上 的 
性 能 瓶颈 越 来 越 明 显 。 于 是 ， 聪 明 的 硬件 设计 师 们 ， 先 到 了 把 内 存 控 
制 器 (原本 北桥 中 读 取 内 存 的 部 分 ) 也 做 个 拆 分 ， 平 分 到 了 每 个 die 
Eo 

NUMA 是 一 个 CPU 的 特性 ，NUMA 中 ， 虽 然 内 存 直接 附属 在 CPU 
上 ， 但 是 由 于 内 存 被 平均 分 配 在 了 各 个 通道 上 。 只 有 当 CPU 访 问 自 身 
直接 附属 内 存 对 应 的 物理 地 址 时 ， 才 会 有 较 短 的 响应 时 间 (后 称 Local 
Access) 。 而 如 果 需 要 访问 其 他 CP 附属 的 内 存 的 数据 时 ， 就 需要 通过 
inter-connect 通 道 访 问 ， 响 应 时 间 就 相 比 之 前 变 慢 了 (后 称 Remote 
Access) 。 所 以 NUMA (Non-Uniform Memory Access) 就 此 得 名 。 

NUMA 中 ， 虽 然 内 存 直接 附属 在 CPU 上 ， 但 是 由 于 内 存 被 平均 分 
配 在 了 各 个 通道 上 。 只 有 当 CPU 访 问 自身 直接 附属 内 存 对 应 的 物理 地 
址 时 ， 才 会 有 较 短 的 响应 时 间 (后 称 Local Access) 。 而 如 果 需 要 访问 
其 他 CPU attach 的 内 存 的 数据 时 ， 就 需要 通过 inter-connect 通 道 访问 ， 响 
应 时 间 就 相 比 之 前 变 慢 了 (后 称 Remote Acces) 。 所 以 NUMA (Non- 
Uniform Memory Access) 就 此 得 名 。 

从 系统 架构 来 说 ， 目 前 的 主流 企业 服务 器 基本 可 以 分 为 三 类 : 
SMP (Symmetric Multi Processing， 对 称 多 处 理 架 构 ) 、NUMA (Non- 
Uniform Memory Access， 非 一 致 存储 访问 架构 ) ， 和 MPP (Massive 
Parallel Processing， 海 量 并 行 处 理 架 构 ) 。 

SMP 架 构 下 CPU 的 核 是 对 称 ， 但 是 他 们 共享 一 条 系统 总 线 。 所 以 
CPU 多 了 之 后 总 线 就 会 成 为 瓶 贷 。 在 NUMA 染 构 下 ， 若 干 CPU 组 成 一 


个 组 ， 组 之 间 有 点 对 点 的 通讯 ， 相 互 独立 。 对 于 用 C/C++ 等 开发 的 程序 
来 说 ， 因 为 程序 直接 决定 了 内 存 的 访问 模式 ， 对 编程 者 而 言 ， 就 需要 
对 对 NUMA 架 构 有 所 了 解 ， 以 最 大 的 利用 NUMA 带 来 的 优势 ， 避 免 反 
被 它 伤害 。 但 对 Java 应 用 来 说 ， 因 为 代码 不 会 直接 执行 ， 一 定 是 通过 
JVM 进 行 ， 所 以 很 大 程度 上 Java 应 用 的 性 能 就 取决 于 JVM 了 。 

MPP 则 是 逻辑 上 将 整个 系统 划分 为 多 个 节点 ， 每 个 节点 的 处 理 器 
只 可 以 访问 本 身 的 本 地 资源 ， 是 完全 无 共享 的 架构 。 节 点 之 间 的 数据 
交换 需要 软件 实施 。 它 的 优点 是 可 扩展 性 非常 好 ; 缺点 是 彼此 数据 交 
换 困 难 ， 需 要 控制 软件 的 大 量 工作 来 实现 通讯 以 及 任务 的 分 配 、 调 
度 ， 对 于 一 般 的 企业 应 用 而 言 过 于 复杂 ， 效 率 不 高 。 

NUMA 架 构 则 在 某 种 意义 上 是 综合 了 SMP 和 MPP 的 特点 : 逻辑 上 
整个 系统 也 是 分 为 多 个 节点 ， 每 个 节点 可 以 访问 本 地 内 存 资 源 ， 也 可 
以 访问 远程 内 存 资源 ， 但 访问 本 地 内 存 资 源 远 远 快 于 远程 内 存 资源 。 
它 的 优点 是 兼顾 了 SMP 和 MPP 的 特点 ， 易 于 管理 ， 可 扩充 性 好 ; 缺点 
是 访问 远程 内 存 资源 的 所 需 时 间 非 常 的 大 。 在 实际 系统 中 使 用 比较 广 
的 是 SMP 和 NUMA 架 构 。 像 传统 的 英特尔 IA 架 构 就 是 SMP， 而 很 多 大 
型 机 采用 了 NUMA 架 构 。 

现在 已 经 进入 了 多 核 时 代 ， 随 着 核 数 的 越 来 越 多 ， 对 于 内 存 厨 吐 
量 和 延迟 有 了 更 高 的 要 求 。 正 是 考虑 到 这 种 需求 ，NUMA 架 构 出 现在 
了 最 新 的 英特尔 下 一 代 Xeon 处 理 器 中 。 目 前 ，Windows Server 2003 和 
Windows XP 64-bit Edition ， Windows XP 等 都 是 NUMA aware 的 ， 而 
Windows Vista 则 有 了 对 Numa 调 度 的 支持 。 所 有 使 用 2.6 版 本 以 上 kernel 
的 Linux 操 作 系 统 都 能 够 支持 NUMA。 而 Solaris、HP-Unix 等 UNIX 操 作 
系统 也 是 充分 支持 NUMA 架 构 的 。 对 于 数据 库 产品 来 说 ，Oracle 从 8i 开 
始 支持 NUMA ， 而 之 后 的 Oracle9i、Oracle10g、Oraclellg 都 能 够 支持 
NUMA。SQL Server 2005 和 SQL Server 2008 均 有 效 地 提供 了 对 NUMA 
的 支持 。 

总 的 来 说 ， 其 实 无 论 是 NUMA 还 是 Linux Kernel， 或 者 是 程序 开发 
他 们 都 没有 错 ， 只 是 还 做 得 不 够 极致 。 如 果 NUMA 在 硬件 级 别 可 以 提 
供 更 多 低 成 本 的 profile 接 口 ; 如 果 Linux Kernel 可 以 使 用 更 科学 的 动态 
调整 策略 ; 如 果 程 序 开发 人 员 更 懂 NUMA， 那 么 我 们 完全 可 以 更 好 地 
发 挥 NUMA 的 性 能 ， 使 得 无 限 横 向 扩展 CPU 核 数 不 再 是 一 个 梦想 。 


4.1.3 Java 算 法 优化 实践 


4.1.3.1 冒 泡 算法 优化 

冒 泡 排序 (Bubble Sort) ， 是 一 种 计算 机 科学 领域 的 较 简 单 的 排序 
算法 。 它 重复 地 走访 过 要 排序 的 数列 ， 一 次 比较 两 个 元 素 ， 如 果 它 们 
的 顺序 错误 就 把 它们 交换 过 来 。 走 访 数列 的 工作 是 重复 地 进行 直到 没 
有 再 需要 交换 ， 也 就 是 说 该 数列 已 经 排序 完成 。 针 对 冒 泡 排序 存在 的 
时 间 复 杂 度 较 高 的 缺点 ， 设 计 了 一 个 优化 方案 。 在 该 优化 方案 中 ， 我 
们 引入 一 个 标志 位 (默认 为 true) ， 如 果 本 次 或 者 本 趟 遍历 前 后 数据 比 
较 发 生 了 交换 ， 则 标志 位 设置 为 tue， 和 否则 为 false， 直 到 又 一 次 数据 没 
有 发 生 交换 ， 说 明 排 序 完 成 。 程 序 如 代码 清单 4-10 所 示 。 


代码 清单 4- 10 冒 泡 算法 优 化 方案 


import java.util.Random; 


public class BubbleSortTuningDemo { 


public static void main(String[] args) { 


// 构 造 数据 

int[] arr = constructDataArray(15); 
System.out.println("----—----- HFM -———---——— "Qus 
printArrayData (arr); 

// Wim 

bubbleSort4(arr); 

System.out.println("--------- 排序 后 一 一- 一 一 一 一 一 a 


printArrayData(arr); 


// 构 造 数 据 
public static int[] constructDataArray(int length) { 
int[] arr = new int[length]; 
Random random - new Random(); 
for(int i=0;i<length;it+) { 
arr[i] = random.nextInt (length) ; 
} 


return arr; 


/** 
* 引入 标志 位 ， 默 认为 true 
* 如 果 前 后 数据 进行 了 交换 ， 则 为 true, GIA false。 如 果 没 有 数据 交换 ， 则 排序 完成 。 
* @param arr 
xA 
public static int[] bubbleSort4(int[] arr) { 
boolean flag - true; 
int n = arr.length; 
while(flag)( 
flag = false; 
for(int j=0;j<n-1; j++) { 
if(arr[j] »arr[j-*1])í 
// 数 据 交换 
int temp = arr[j]; 
arr[j] = arr[j*1]; 
arr[j*1] = temp; 
// 设 置 标志 位 
flag = true; 


return arr; 


/V/ 打 印 数据 


public static void printArrayData(int[] arr) { 
for(int d :arr) { 
System.out.print(d +" "); 


} 
System.out.println(); 


} 
代码 清单 4-10 的 运行 输出 如 清单 4-11 所 示 。 


代码 清单 4-11 运行 输出 
p 有 
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4.1.3.2 Arrays 类 中 的 排序 算法 

Arrays 类 中 主要 有 二 分 法 查找 (binarySearch 方 法 ) 算法 和 归并 排 
Fr (sort 方 法 ) 两 种 。 

二 分 法 查找 算法 的 算法 思想 决定 了 当 数 据 量 很 大 适宜 采用 该 方 
法 。 采 用 二 分 法 查找 时 ， 数 据 需 是 排 好 序 的 。 基 本 思想 是 假设 数据 是 
按 升 序 排序 的 ， 对 于 给 定 值 x， 从 序列 的 中 间 位 置 开 始 比较 ， 如 果 当 前 
位 置 值 等 于 x， 则 查找 成 功 ;， 若 x 小 于 当前 位 置 值 ， 则 在 数列 的 前 半 段 
中 查找 ; 若 x 大 于 当前 位 置 值 则 在 数列 的 后 半 段 中 继续 查找 ， 直 到 找到 
为 止 。 源 代码 如 代码 清单 4-12 所 示 。 


代码 清单 4-12 二 分 法 查找 算法 
// 针 对 int 类 型 数组 的 二 分 法 查找 ，key 为 要 查找 数 的 下 标 
private static int binarySearch0(int[] a, int fromIndex, int toIndex, int key) { 
int low = fromIndex; 
int high = toIndex - 1; 
while (low <= high) { 
int mid = (low + high) >>> 1;// 无 符号 左 移 一 位 ， 相 当 于 除 以 二 
int midVal = a[mid]; 
if (midVal « key) 
low = mid + 1; 
else if (midVal > key) 
high = mid - 1; 
else 
return mid; // key found 
} 
return -(low + 1); // key not found. 


} 


Arrays 的 排序 方法 是 这 样 的 : 

(1) 如 果 数 组 元 素 的 个 数 小 于 7， 直 接 插 入 排序 。 我 不 知道 这 个 7 

不 是 实践 当中 的 最 佳 参数 ， 其 实 我 认为 小 于 10 都 行 。 毕 竟 快 排 是 需 

递归 实现 的 ， 每 次 递归 都 需要 一 定 的 开销 。 

(2) 数组 元 素 的 个 数 大 于 7， 人 快速 排序 。 快 速 排序 每 一 步 中 ， 需 
要 选取 一 个 元 素 作 为 pivot 来 划分 子 序列 。 最 理想 的 状态 就 是 每 次 选取 
的 pivot 能 将 序列 均 分 为 两 个 长 度 差不多 的 子 序列 。jdk 中 排序 算法 是 这 
样 选 择 pivot 的 : 对 一 个 长 度 为 lan 的 数组 a， 选 择 a[0]、allen/8]、 
a[2*len/8]. a[3*len/8]. a[A*len/8]. a[5*len/8]. a[6*len/8]. a[7*len/8]. 
a[8*len/8] 这 9 个 数 的 中 间 值 作为 pivot。 

sort () 方法 针对 引用 类 型 数组 采取 的 算法 是 归并 排序 。 算 法 思想 
是 ， 归 并 (Merge) 排序 法 是 将 两 个 (或 两 个 以 上 ) 有 序 表 合并 成 一 个 


新 的 有 序 表 ， 即 把 竺 排序 序 列 分 为 若干 个 子 序 列 ， 每 个 子 序列 是 有 序 
的 。 然 后 再 把 有 序 子 序列 合并 为 整体 有 序 序列 。 
sot () 方法 针对 整形 数据 采取 的 是 快速 排序 算法 ， 算 法 思想 : 通 
一 趟 排序 将 要 排序 的 数据 分 割 成 独立 的 两 部 分 ， 其 中 一 部 分 的 所 有 
EBS OPER 效 据 都 要 小 ， 然 后 再 按 此 方法 对 这 两 部 分 
数据 分 别 进行 快速 排序 ， 整 个 排序 过 程 可 以 递归 进行 ， 以 此 达到 整个 
数据 变 成 有 序 序列 。 代 码 如 代码 清单 4-13 所 示 。 


代码 清单 4-13 ”归并 排序 算法 
public class ArraySourceCode { 
/[** 
* Swaps x[a] with x[b]. 
di 
private static void swap(int x[], int a, int b) ( 
int t = x[a]; 
x[a] = x[b]; 
x[b] = t; 


public static void sort(int[] a) { 


sortl(a, 0, a.length); 


private static int med3(int x[], int a, int b, int c) {// 找 出 三 个 中 的 中 间 值 
return (x[a] < x[b] ? 
(x[b] < x[c] ?b : xla] < x[c] ?c: a): 
(x[b] » xe] 2b : x[a] ^ x[e] ? e : ay 


/** 
* Sorts the specified sub-array of integers into ascending order. 
ay 
private static void sortl(int x[], int off, int len) { 
// Insertion sort on smallest arrays 
if (len < 7) {// 采 用 冒 泡 排序 
for (int i=off; i<lentoff; i++) 
for (int j=l; j>off && x[j-1]>x[j]; j--) 
swap(x, J, j-1); 


return; 


) 
// 采 用 快速 排序 


// Choose a partition element, v 


int m = off + (len >> 1); // Small arrays, middle element 


if (len > 7) { 
int 1 = off; 


int n = off + len - 1; 
if (len > 40) { // Big arrays, pseudomedian of 
int s = len/8; 
1 = med3(x, 1, irs, lI*2*5);:r 
m = med3(x, m-s, m, m+s); 
n = med3(x, n-2*s, n-s, n); 
} 
m = med3(x, 1, m, n); // Mid-size, med of 3 
} 
int v = x[m]; 


// Establish Invariant: v* («v)* (>v)* v* 
int a = off, b =a, c = off + len - 1, d = c; 
while(true) { 

while (b <= c && x[b] <= v) { 


if (x[b] == v) 
swap(x, a++, b); 
b*-4s 


) 
while (c >= b && x[c] >= v) { 
if (x[c] == v) 
swap(x, c, d--); 
Gi. 
) 
if (b > &) 
break; 
Swap(x, b++, c--); 


// Swap partition elements back to middle 
int s, n = off + len; 

S = Math.min(a-off, b-a ); 

vecswap(x, off, b-s, s); 

s = Math.min(d-c, n-d-1); 


vecswap (x, b, n=S, S5): 


// Recursively sort non-partition-elements 
if (ts = b=a) > 1) 

sorti (x, off, s); 
if ((s = d=-e) > 1) 


sortl (x, n-s, s); 
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} 


针对 double、float 类 型 数组 排序 的 sort () 方法 ， 采 取 了 先 把 所 有 
的 数组 元 素 值 为 -0.0d 的 元 素 转换 成 0.0d4， 有 再 利用 快速 排序 排 好 序 ， 最 后 
再 还 原 。 

此 外 ， 有 别 于 Arrays 类 ，LinkedList 类 的 排序 不 是 采用 归并 实现 
的 ， 而 是 把 元 素 复 制 到 数组 后 ， 再 调用 快速 排序 。 

4.1.3.3 DualPivotQuicksort 类 

在 JDK7 中 新 增 了 java.util.DualPivotQuicksort 这 个 类 ， 里 面 实 现 于 
2009 年 发 表 的 Dual-Pivot Quicksort 算 法 。 其 主要 的 设计 是 改进 了 
Quicksort 算 法 [2]， 使 之 效率 大 幅 提 高 ， 因 此 Collections.sort () ~ 
Arrays.sort () 等 的 实现 部 分 使 用 了 这 个 类 。 

一 般 的 快速 排序 采用 一 个 枢 轴 来 把 一 个 数组 划分 成 两 半 ， 然 后 递 
归 计 算 ， 大 量 经验 数据 表面 ， 采 用 两 个 枢 轴 来 划分 成 3 份 的 算法 更 高 
效 ， 因 此 DualPivotQuicksort 类 采用 的 是 这 种 方式 。 这 种 算法 需要 选举 
出 两 个 枢 轴 Pl1 和 P2， 需 要 3 个 指针 L、K、G，3 个 指针 的 作用 如 图 4-2 所 


o 
a eee 2 
left L K G right 
part I part II part IV part III 


图 4-2 DualPivotQuicksort75 xt 
算法 步骤 按照 下 面 的 7 点 顺序 依次 进行 。 
(1) 小 于 27 的 数组 ， 使 用 插入 排序 (或 47) o 
(2) 选择 枢 轴 P1 和 P2 (假设 使 用 数组 头 和 尾 ) o 
(3) P1 需 要 小 于 P2， 否 者 交换 。 现 在 数组 被 分 成 4 份 ，left 到 工 的 
小 于 P1 的 数 ，L 到 K 的 大 于 P1 小 于 P2 的 数 ，G 到 rigth 的 大 于 P2 的 数 ， 待 
处 理 的 K 到 G 的 中 间 的 数 (逐步 被 处 理 到 前 3 个 区 域 中 ) 。 


(4) 工 从 开始 初始 化 直至 不 小 于 P1，K 初 始 化 为 L-1，G 从 结尾 初 
始 化 直至 不 大 于 P2。 开 是 主 移动 的 指针 ， 来 一 步 一 步 吞 哦 中间 区 域 。 

**** 当 大 于 P1 小 于 P2，K++o 

**** 当 小 于 Pl1， 交 换 L 和 KK 的 数 ，L++，K++。 

**** 当 大 于 P2， 如 果 G 的 数 小 于 Pl1， 把 L 上 的 数 放 在 K 上 ， 把 G 的 
数 放 在 L 上 ，L++， 再 把 K 以 前 的 数 放 在 G 上 ，G-，K++， 完 成 一 次 L、 
K、G 的 互相 交换 。 否 则 交换 K 和 G， 并 G-，K++。 


(5) 递归 4。 
(6) 交换 P1 到 L-1 上 。 交换 P2 到 G+1 上 。 
(7) 递归 。 


上 述 流程 的 流程 图 如 图 4-3 所 示 。 


单 区 快速 选取 1| 。 ， 
区 
使 用 3 指针 划分 
成 3 部 分 
对 两 部 分 递归 
使 用 3 指针 把 中 
r 长 Eo 间 划 分 成 3 部 
分 ， 共 5 份 
中 间 部 分 为 3 份 
中 间 部 分 不 变 的 中 间 
递归 3 部 分 


图 4-3 DualPivotQuicksort 流 程 图 

4.1.3.4 线程 池 实 现 算法 分 析 

线程 池 是 一 种 多 线程 处 理 形 式 ， 处 理 过 程 中 将 任务 添加 到 队列 ， 
然后 在 创建 线程 后 自动 启动 这 些 任 务 。 线 程 池 线程 都 是 后 台 线 程 。 每 
个 线程 都 使 用 默认 的 堆栈 大 小 ， 以 默认 的 优先 级 运行 ， 并 处 于 多 线程 
单元 中 。 如 果 某 个 线程 在 托管 代码 中 空 闪 (如 正在 等 待 某 个 事件 ) ， 
则 线程 闻 将 插入 另 一 个 辅助 线程 来 使 所 有 处 理 器 保持 繁忙 。 如 果 所 有 
线程 池 线程 都 始终 保持 繁忙 ， 但 队列 中 包含 挂 起 的 工作 ， 则 线程 池 将 
在 一 段 时 间 后 创建 另 一 个 辅助 线程 但 线程 的 数目 永远 不 会 超过 最 大 
值 。 超 过 最 大 值 的 线程 可 以 排队 ， 但 他 们 要 等 到 其 他 线程 完成 后 才 启 
动 。 

我 们 在 编写 Java 程 序 的 过 程 中 也 经 常 使 用 到 线程 池 技术 ， 它 的 优点 
包括 如 下 3 点 。 

m 复 用 : 类 似 Web 服 务 器 等 系统 ， 长 期 来 看 内 部 需要 使 用 大 量 的 线 
程 处 理 请 求 ， 而 单 次 请 求 响 应 时 间 通 常 比较 短 ， 此 时 Java 基 于 操作 系统 
的 本 地 调用 方式 大 量 的 创建 和 销毁 线程 本 身 会 成 为 系统 的 一 个 性 能 瓶 
颈 和 资源 瀛 费 。 若 使 用 线程 闻 技 术 可 以 实现 工作 线程 的 复 用 ， 即 一 个 
工作 线程 创建 和 销毁 的 生命 周期 期 间 内 可 以 执行 处 理 多 个 任务 ， 从 而 
总 体 上 降低 线程 创建 和 销毁 的 频率 和 时 间 ， 提 升 了 系统 性 能 。 

mc: 服务 器 资源 有 限 ， 超 过 服务 器 性 能 的 过 高 并 发 设置 反而 成 
为 系统 的 负担 ， 造 成 CPU 大 量 耗 费 于 上 下 文 切 换 、 内 存 洪 出 等 后 果 。 
通过 线程 池 技术 可 以 控制 系统 最 大 并 发 数 和 最 大 处 理 任务 量 ， 从 而 很 
好 地 实现 流 控 ， 保 证 系统 不 至 于 朋 溃 。 

m 功能: JDK 的 线程 池 实现 的 非常 灵活 ， 并 提供 了 很 多 功能 ， 一 些 
场景 基于 功能 的 角度 会 选择 使 用 线程 池 。 

JDK、Jetty、Tomcat， 这 几 种 编程 模型 或 者 容器 分 别 都 实现 了 线程 
池 ， 但 是 它们 所 采用 的 算法 是 不 一 样 的 。 

对 于 线程 闻 构 造 与 工作 者 初始 化 步骤 ，JDK 默 认 初 始 化 后 不 启动 工 
作者 ， 等 待 有 请 求 时 才 启 动 。 可 以 通过 调用 线程 闻 接 口 提前 启动 核心 
工作 数 个 工作 者 线程 ， 也 可 以 启动 业务 期 望 的 多 个 工作 者 线程 。Jetty 6 
初始 化 后 直接 启动 minThreads 个 工作 者 线程 。Jetty 8 初始 化 后 直接 启 
动 minThreads 个 工作 者 线程 。Tomcat 基 于 JDK 线 程 池 的 构造 方法 。 


对 于 工作 者 线程 存储 及 并 发 管理 ，JDK 使 用 了 HashSet 来 存储 工作 
者 线程 ， 通 过 可 重 入 锁 ReentrantLock 对 其 进行 并 发 保护 。 每 个 worker 都 
是 一 个 Runnable 接 口 。Jetty 6 同样 使 用 了 HashSet 存 储 工 作者 线程 ， 通 过 
synchronized 一 个 对 象 进行 HashSet 的 并 发 保护 。 每 个 工作 者 实际 上 是 一 
个 Thread 的 扩展 。Jetty 8 使 用 了 ConcurrentLinkedQueue 存 储 工 作者 
workers， 利 用 JDK 基 于 CAS 算 法 的 实现 提高 了 并 发 效率 ， 同 时 也 降低 
了 线程 池 并 发 保护 的 复杂 程度 。 针 对 队列 ConcurrentLinkedQueue 无 法 
保证 size () 实时 性 问题 引入 原子 变量 AtomicInteger 统 计 工 作者 数量 。 
Tomcat 是 基于 JDK 的 ThreadPoolExecutors 实 现 ， 复 用 JDK 业 务 。 

对 于 待 处 理工 作 队 列 结构 ，JDK 使 用 了 实现 接口 BlockingQueue 的 
阻塞 队列 来 存储 待 处 理工 作 job， 并 把 队列 作为 构造 亢 数 参数 ， 从 而 实 
现 业务 可 以 灵活 的 扩展 定制 线程 池 的 队列 。 业 务 也 可 使 用 JDK 自 身 的 同 
步 阻塞 队列 SynchronousQueue、 有 界 队 列 ArrayBlockingQueue、 无 界 队 
列 LinkedBlockingQueue、 优 先 级 队列 PriorityBlockingQueue。 Jetty 6 使 
用 了 数组 存储 待 处 理 的 job 对 象 Runnable。 数 组 初始 化 容量 为 
_maxThreads 个 ， 使 用 变量 _queued 计 算 保 存 当 前 内 部 待 处 理 job 的 个 数 
即 数 组 length。 超 过 数组 最 大 值 时 ， 扩 大 _maxThreads 个 容量 ， 因 此 数 
组 永远 够 用 够 大 ， 容 量 无 界 。 同 样 是 用 synchronized 一 个 对 象 的 方式 实 
现 同步 。Jetty 8 与 JDK 相 同 实现 ， 使 用 了 基于 接口 BlockingQueue 的 阻塞 
队列 来 存储 待 处 理工 作 job ， 也 支持 在 线程 池 构 造 永 数 的 参数 中 传 入 队 
列 类 型 。 同 时 ，Jetty8 内 部 默认 未 设置 队列 类 型 场景 可 自动 设置 使 用 2 
种 队列 : 有 界 无 法 扩容 的 ArrayBlockingQueue 及 Jetty 自 身 定制 扩展 实现 
的 可 扩容 队列 BlockingArrayQueue。 Tomcat 复 用 了 JDK 方 式 。 

对 比 几 种 线程 池 实 现 ，JDK 的 实现 是 最 为 灵活 、 功 能 最 强 且 扩展 性 
最 好 的 ，Tomcat 即 基于 JDK 线 程 池 功能 扩展 实现 ， 复 用 原 有 业务 的 同时 
扩充 了 自己 的 业务 。Jetty6 是 完全 自己 定制 的 线程 池 业 务 ， 耦 合 线程 池 
众多 复杂 的 业务 逻辑 到 线程 池 类 里 面 ， 逻 辑 相 对 最 为 复杂 ， 扩 展 性 也 
非常 差 。Jetty8 相 对 Jetty6 的 实现 简化 了 很 多 ， 其 中 利用 了 JDK 中 的 同步 
容器 和 原子 变量 ， 同 时 实现 方式 也 越 来 越 接 近 JDK。 


4.2 设计 模式 


设计 模式 总 的 来 说 融 是 对 竺 特定 问题 的 成 熟 的 解决 方案 ， 如 果 能 
够 合理 地 使 用 设计 模式 ， 会 让 整个 代码 工程 显得 更 加 有 成 效 ， 但 是 如 
果 肆 意 乱 用 ， 也 会 起 到 反作用 。 笔 者 在 面试 过 程 中 会 询问 设计 模式 的 
使 用 ， 但 是 很 少 有 学 生 接 触 过 ， 这 确实 是 我 们 的 教育 出 了 问题 。 教 育 
的 目的 是 为 了 就 业 ， 教 授 也 需要 有 很 强 的 实践 动手 能 力 ， 而 不 是 理论 
知识 ， 再 高 大 上 的 理论 ， 对 于 大 多 数学 生 而 言 没 有 多 大 用 处 。 


4.2.1 设计 模式 的 六 大 准则 


1. 开 闭 原则 (Open Close Principle) 

在 软件 的 生命 周期 内 ， 因 为 变化 、 升 级 和 维护 等 原因 需要 对 软件 
原 有 代码 进行 修改 时 ， 可 能 会 给 上 日 代码 中 引入 错误 ， 也 可 能 会 使 我 们 
不 得 不 对 整个 功能 进行 重 构 ， 并 且 需 要 原 有 代码 经 过 重新 测试 。 如 何 
解决 这 类 问题 呢 ? 解决 方法 是 当 软 件 需要 变化 时 ， 尽 量 通过 扩展 软件 
实体 的 行为 来 实现 变化 ， 而 不 是 通过 修改 已 有 的 代码 来 实现 变化 。 这 
就 是 开 闭 原则 。 

开 闭 原则 就 是 说 对 扩展 开放 ， 对 修改 关闭 。 在 程序 需要 进行 拓展 
的 时 候 ， 不 能 去 修改 原 有 的 代码 ， 实 现 一 个 热 插 拔 的 效果 。 所 以 一 句 
话 概括 就 是 , “为 了 使 程序 的 扩展 性 好 ， 易 于 维护 和 升级 ”。 想 要 达到 
这 样 的 效果 ， 我 们 需要 使 用 接口 和 抽象 类 。 

开 闭 原则 无 非 就 是 想 表达 这 样 一 层 意思 ， 用 抽象 构建 框架 ， 用 实 
现 扩 展 细节 。 因 为 抽象 灵活 性 好 ， 适 应 性 广 ， 只 要 抽象 的 合理 ， 可 以 
基本 保持 软件 架构 的 稳定 。 而 软件 中 易 变 的 细节 ， 我 们 用 从 抽象 派生 
的 实现 类 来 进行 扩展 ， 当 软件 需要 发 生变 化 时 ， 我 们 只 需要 根据 需求 
重新 派生 一 个 实现 类 来 扩展 就 可 以 了 。 当 然 前 提 是 我 们 的 抽象 要 合 
理 ， 要 对 需求 的 变更 有 前 上 性 和 预见 性 才 行 。 

2. 里 氏 代 换 原则 [3] (Liskov Substitution Principle) 

假设 一 个 问题 ， 有 一 功能 P1， 由 类 A 完 成 。 现 需要 将 功能 P1 进 行 扩 
展 ， 扩 展 后 的 功能 为 P， 其 中 P 由 原 有 功能 P1 与 新 功能 P2 组 成 。 新 功能 了 
由 类 A 的 子 类 B 来 完成 ， 则 子 类 B 在 完成 新 功能 P2 的 同时 ， 有 可 能 会 导 
致 原 有 功能 P1 发 生 故 障 。 解 决 方法 是 当 使 用 继承 时 ， 遵 循 里 氏 蔡 换 原 
则 。 类 B 继 承 类 A 时 ， 除 添加 新 的 方法 完成 新 增 功能 P2 外 ， 尽 量 不 要 重 
写 父 类 A 的 方法 ， 也 尽量 不 要 重 载 父 类 A 的 方法 。 


里 氏 代 换 原 则 (Liskov Substitution Principle LSP) 面向 对 象 设 计 的 
基本 原则 之 一 。 里 氏 代 换 原 则 中 说 ， 任 何 基 类 可 以 出 现 的 地 方 ， 子 类 
一 定 可 以 出 现 。LSP 是 继承 复 用 的 基石 ， 只 有 当 衍 生 类 可 以 替换 掉 基 
类 ， 软 件 单 位 的 功能 不 受到 影响 时 ， 基 类 才能 真正 被 复 用 ， 而 衍生 类 
也 能 够 在 基 类 的 基础 上 增加 新 的 行为 。 里 氏 代 换 原则 是 对 “ 开 - 闭 ”原则 
的 补充 。 实 现 “ 开 - 闭 ” 原 则 的 关键 步骤 就 是 抽 销 化 。 而 基 类 与 子 类 的 继 
承 关 系 就 是 抽象 化 的 具体 实现 ， 所 以 里 氏 代 换 原则 是 对 实现 抽象 化 的 
具体 步骤 的 规范 。 

里 氏 替 换 原 则 通俗 的 来 讲 就 是 : 子 类 可 以 扩展 父 类 的 功能 ， 但 不 
能 改变 父 类 原 有 的 功能 。 它 包含 以 下 4 层 含义 : 

m 子 类 可 以 实现 父 类 的 抽象 方法 ， 但 不 能 覆盖 父 类 的 非 抽 象 方法 。 
昌 子 类 中 可 以 增加 自己 特有 的 方法 。 

m 当 子 类 的 方法 重 载 父 类 的 方法 了 时， 方法 的 前 置 条 件 ( 即 方法 的 形 
要 比 父 类 方法 的 输入 人 参数 更 宽松 。 

m 当 子 类 的 方法 实现 父 类 的 抽象 方法 时 ， 方法 的 后 置 条 件 ( 即 方法 
的 返回 值 ) 要 比 父 类 更 严格 。 

3. 依 赖 倒转 原则 (DependenceInversion Principle) 

这 个 是 开 闭 原则 的 基础 ， 具 体内 容 : 真 对 接口 编程 ， 依 赖 于 抽象 
而 不 依赖 于 具体 。 采 用 依赖 倒置 原则 可 以 减少 类 间 的 耦合 性 ， 提 高 系 
统 的 稳定 性 ， 减 少 并 行 开发 引起 的 风险 ， 提 高 代码 的 可 读 性 和 可 维护 
性 。 

依赖 倒转 原则 的 本 质 就 是 通过 抽象 (接口 或 抽象 类 ) 使 各 个 类 或 
模块 的 实现 彼此 独立 ， 不 互相 影响 ， 实 现 模块 间 的 松 耦 合 ， 我 们 怎么 
在 项 目 中 使 用 这 个 规则 呢 ? 需要 遵循 以 下 的 几 个 规则 。 

m 每 个 类 尽量 都 有 接口 或 抽象 类 ， 或 者 抽象 类 和 接口 两 者 都 具备 

这 是 依赖 倒置 的 基本 要 求 ， 接 口 和 抽象 类 都 是 属于 抽象 的 ， 有 了 
抽象 才 可 能 依赖 倒置 。 

m 变量 的 显示 类 型 尽量 是 接口 或 者 是 抽象 类 

很 多 书 上 说 变量 的 类 型 一 定 要 是 接口 或 者 是 抽象 类 ， 这 个 有 点 绝 
对 化 了 ， 比 如 一 个 工具 类 ，xxxUtils 一 般 是 不 需要 接口 或 是 抽象 类 的 。 
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还 有 ， 如 果 你 要 使 用 类 的 Clone 方法， 就 必须 使 用 实现 类 ， 这 个 是 JDK 
提供 一 个 规范 。 

m 任何 类 都 不 应 该 从 具体 类 派生 

如 果 一 个 项 目 处 于 开发 状态 ， 确 实 不 应 该 有 从 有 具体 类 派生 出 的 子 
类 的 情况 ， 但 这 也 不 是 绝对 的 ， 因 为 人 都 是 会 犯错 误 的 ， 有 时 设计 缺 
陷 是 在 所 难免 的 ， 因 此 只 要 不 超过 两 层 的 继承 都 是 可 以 忍受 的 。 特 别 
是 做 项 目 维护 的 同志 ， 基 本 上 可 以 不 考虑 这 个 规则 ， 为 什么 ? 维护 工 
作 基 本 上 都 是 做 扩展 开发 ， 修 复 行为 ， 通 过 一 个 继承 关系 ， 覆 写 一 个 
方法 就 可 以 修正 一 个 很 大 的 Bug， 何 必 再 要 去 继承 最 高 的 基 类 呢 ? 

尽量 不 要 覆 写 基 类 的 方法 

如 果 基 类 是 一 个 抽象 类 ， 而 且 这 个 方法 已 经 实现 了 ， 子 类 尽量 不 
要 帮 写 。 类 间 依 赖 的 是 抽象 ， 履 写 了 抽象 方法 ， 对 依赖 的 稳定 性 会 产 
生 一 定 的 影响 。 

m 结合 里 氏 蔡 换 原 则 使 用 

接口 负责 定义 public 属 性 和 方法 ， 并 且 声 明 与 其 他 对 象 的 依赖 关 
系 ， 抽 象 类 负责 公共 构造 部 分 的 实现 ， 实 现 类 准确 的 实现 业务 逻辑 ， 
同时 在 适当 的 时 候 对 父 类 进行 细 化 。 

4. 接 口 隔 离 原则 (Interface Segregation Principle) 

这 个 原则 的 意思 是 说 ， 使 用 多 个 隔离 的 接口 ， 比 使 用 单个 接口 要 
好 。 还 是 一 个 降低 类 之 间 的 耦合 度 的 意思 ， 从 这 儿 我 们 看 出 ， 其 实 设 
计 模 式 就 是 一 个 软件 的 设计 思想 ， 从 大 型 软件 架构 出 发 ， 为 了 升级 和 
维护 方便 。 

很 多 人 会 觉得 接口 隔离 原则 跟 单一 职责 原则 很 相似 ， 其 实 不 然 。 
其 一 ， 单 一 职责 原则 上 注重 的 是 职责 ; 而 接口 隔离 原则 注重 对 接口 依 
赖 的 隔离 。 其 二 ， 单 一 职责 原则 主要 是 约束 类 ， 其 次 才 是 接口 和 方 
法 ， 它 针对 的 是 程序 中 的 实现 和 细节 ; 而 接口 隔离 原则 主要 约束 接 
口 ， 主 要 针对 抽象 ， 针 对 程序 整体 框架 的 构建 。 

采用 接口 隔离 原则 对 接口 进行 约束 时 ， 要 注意 以 下 几 点 : 

四 接口 尽量 小 ， 但 是 要 有 限度 。 对 接口 进行 细 化 可 以 提高 程序 设计 
灵活 性 是 不 争 的 事实 ， 但 是 如 果 过 小 ， 则 会 造成 接口 数量 过 多 ， 使 设 
计 复 杂 化 。 所 以 一 定 要 适度 。 


m 为 依赖 接口 的 类 定制 服务 ， 只 暴露 给 调用 的 类 它 需 要 的 方法 , É 
不 需要 的 方法 则 隐藏 起 来 。 只 有 专注 地 为 一 个 模块 提供 定制 服务 ， 才 
能 建立 最 小 的 依赖 关系 。 

四 提高 内 聚 ， 减 少 对 外 交互 。 使 接口 用 最 少 的 方法 去 完成 最 多 的 事 
情 。 

运用 接口 隔离 原则 ， 一 定 要 适度 ， 接 口 设 计 的 过 大 或 过 小 都 不 
好 。 设 计 接 口 的 时 候 ， 只 有 多 人 花 些 时 间 去 思考 和 筹划 ， 才 能 准确 地 实 
践 这 一 原则 。 

5. 迪 米 特 法 则 [4] (最 少 知道 原则 ，Demeter Principle) 

为 什么 叫 最 少 知道 原则 ， 就 是 说 ， 一 个 实体 应 当 尽 量 少 的 与 其 他 
实体 之 间 发 生 相 互 作 用 ， 使 得 系统 功能 模块 相对 独立 。 比 如 ， 一 个 类 
公开 的 public 属 性 或 方法 越 多 ， 修 改 时 涉及 的 面 也 就 越 大 ， 变 更 引起 的 
风险 扩散 也 就 越 大 。 因 此 ， 为 了 保持 朋友 类 间 的 距离 ， 在 设计 时 需要 
反复 衡量 : 是 否 还 可 以 再 减少 public 方 法 和 属性 ， 是 否 可 以 修改 为 
private. package-private ( 包 类 型 ， 在 类 、 方 法 、 变 量 前 不 加 访问 权 
限 ， 则 默认 为 包 类 型 ) 、protected 等 访问 权限 ， 是 否 可 以 加 上 final 关 键 
字 等 。 

如 果 一 个 系统 符合 迪 米 特 法 则 ， 那 么 当 其 中 某 一 个 模块 发 生 修改 
时 ， 就 会 尽量 少 地 影响 其 他 模块 ， 扩 展会 相对 容易 ， 这 是 对 软件 实体 
之 间 通 信 的 限制 ， 迪 米 特 法 则 要 求 限 制 软件 实体 之 间 通 信 的 宽度 和 深 
度 。 迪 米 特 法 则 可 降低 系统 的 耦合 度 ， 使 类 与 类 之 间 保 持 松 散 的 耦合 
关系 。 

迪 米 特 法 则 要 求 我 们 在 设计 系统 时 ， 应 该 尽量 减少 对 象 之 间 的 交 
互 ， 如 果 两 个 对 象 之 间 不 必 彼 此 直接 通信 ， 那 么 这 两 个 对 象 就 不 应 当 
发 生 任何 直接 的 相互 作用 ， 如 果 其 中 的 一 个 对 象 需要 调用 另 一 个 对 象 
的 某 一 个 方法 的 话 ， 可 以 通过 第 三 者 转发 这 个 调用 。 简 言 之 ， 就 是 通 
过 引入 一 个 合理 的 第 三 者 来 降低 现 有 对 象 之 间 的 耦合 度 。 

在 将 迪 米 特 法 则 运用 到 系统 设计 中 时 ， 要 注意 下 面 的 几 点 : 

m 在 类 的 划分 上 上， 应 当 尽 量 创建 松 耘 合 的 类 ， 类 之 间 的 耦合 度 越 
低 ， 就 越 有 利于 复 用 ， 一 个 处 在 松 耦 合 中 的 类 一 旦 被 修改 ， 不 会 对 天 
联 的 类 造成 太 大 波及 。 


e 在 类 的 结构 设计 上 ， 每 一 个 类 都 应 当 尽 量 降 低 其 成 员 变 量 和 成 员 
函数 的 访问 权限 ; 在 类 的 设计 上 ， 只 要 有 可 能 ， 一 个 类 型 应 当 设 计 成 
RB, 

m 在 对 其 他 类 的 引用 上 ， 一 个 对 象 对 其 他 对 象 的 引用 应 当 降 到 最 
{ro 

注意 ， 迪 米 特 法 则 的 核心 观念 就 是 类 间 解 而 ， 弱 看 合 ， 只 有 弱 厅 
合 了 以 后 ， 类 的 复 用 率 才 可 以 提高 。 

6. 合 成 复 用 原则 (Composite Reuse Principle) 

原则 是 尽量 使 用 合成 /聚合 的 方式 ， 而 不 是 使 用 继承 。 只 有 当 以 下 
的 条 件 全 部 被 满足 时 ， 才 应 当 使 用 继承 关系 。 

(1) 子 类 是 超 类 的 一 个 特殊 种 类 ， 而 不 是 超 类 的 一 个 角色 ， 也 就 
是 区 分 “Has-A” 和 “Is-A”。 只 有 “Is-A” 关 系 才 符合 继承 关系 ，“Has-A” 关 
系 应 当 使 用 聚合 来 描述 。 

(2) 永远 不 会 出 现 需要 将 子 类 换 成 另外 一 个 类 的 子 类 的 情况 。 如 
果 不 能 肯定 将 来 是 否 会 变 成 另外 一 个 子 类 的 话 ， 就 不 要 使 用 继承 。 

(3) 子 类 具有 扩展 超 类 的 责任 ， 而 不 是 具有 置换 掉 或 注销 掉 超 类 
的 责任 。 如 果 一 个 子 类 需要 大 量 的 置换 掉 超 类 的 行为 ， 那 么 这 个 类 就 
不 应 该 是 这 个 超 类 的 子 类 。 

错误 地 使 用 继承 而 不 是 合成 聚合 的 一 个 常见 原因 是 错误 地 把 
“Has-A” 当 成 了 “Is-A”。 “Is-A” 代 表 一 个 类 是 另外 一 个 类 的 一 种 ， 而 
“Has-A” 代 表 一 个 类 是 另外 一 个 类 的 一 个 角色 ， 而 不 是 另外 一 个 类 的 特 
殊 种 类 。 

综合 上 面 所 陈述 的 六 点 原则 ， 我 们 可 以 这 么 来 总 结 ， 六 项 原则 的 
关系 如 图 4-4 所 示 。 
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图 4-4 六 项 原则 合并 
图 中 的 每 一 条 维度 各 代表 一 项 原则 ， 我 们 依据 对 这 项 原则 的 遵守 
程度 在 维度 上 男 一 个 点 ， 则 如 果 对 这 项 原则 遵守 的 合理 的 话 ， 这 个 点 


应 该 落 在 红色 的 同心 圆 内 部 ; 如 果 遵 守 的 差 ， 上 点 将 会 在 小 圆 内 部 ; 如 
果 过 度 遵 守 ， 上 点 将 会 沙 在 大 圆 外 部 。 一 个 展 好 的 设计 体现 在 图 中 ， 应 
该 是 六 个 顶点 都 在 同心 圆 中 的 六 边 形 。 


在 图 4-5 中 ， 设 计 1、 设 计 2 属 于 良好 的 设计 ， 他 们 对 六 项 原则 的 遵 
守 程 度 都 在 合理 的 范围 内 ;设计 3、 设 计 4 设 计 虽 然 有 些 不 足 ， 但 也 基 
本 可 以 接受 ; 设计 5 则 严重 不 足 ， 对 各 项 原则 都 没有 很 好 的 遵守 ; Mix 
计 6 则 遵守 过 渡 了 ， 设 计 5 和 设计 6 都 是 迫切 需要 重 构 的 设计 。 
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图 4-5 六 项 原则 单独 分 开 
4.2.2 单一 对 象 控制 


二 次 世界 大 战 的 时 候 ， 我 国有 一 个 著名 的 战役 叫 “ 长 沙 保卫 战 ”， 
中 国 军 队 指挥 官 薛 岳 将 军 率领 第 9 战区 十 余 万 将 士 ， 通 过 所 谓 的 “焦土 ” 
gee atid E Nig ceca 合 对 当时 的 国民 党 政府 打 了 一 针 强 心 
剂 。 这 四 次 战役 中 最 让 人 我 难 志 的 一 幕 是 ， 面 对 单 兵 战斗 力 是 中 国 军 
A 人 数 上 虽然 占据 一 定 优势 ， 但 是 只 有 第 10 军 和 第 74 军 两 
只 军队 装备 了 现代 化 的 军械 ， 其 余 军 队 都 是 “汉阳 造 ” 的 落后 装备 。 薛 
将 军 命令 第 10 军 反复 在 湘北 、 浊 诸 北 多 处 出 阵地 来 回 穿插 ， 面 对 东西 方 
向 出 现 的 多 路 敌 军 ， 帮 助 装备 落后 的 部 队 一 起 防守 阵地 ， 让 敌人 误 以 
为 是 多 支部 队 ， 其 实 薛 岳 将 军 只 是 调动 了 同一 支部 队 ， 正 是 这 一 单一 
实例 的 对 象 (第 10 军 ) 在 各 个 战场 均 发 挥 出 了 显著 的 作用 ， 为 第 二 次 
长 沙 战 役 的 全 面 获 胜 起 了 至 关 重 要 的 作用 。 

回 到 技术 主题 ， 从 专业 化 来 说 ， 单 例 模 式 是 一 种 对 象 创 建 模式 ， 
它 用 于 产生 一 个 对 象 的 具体 实例 ， 它 可 以 确保 系统 中 一 个 类 只 产生 一 


个 实例 。Java 里 面 实现 的 单 例 是 一 个 虚拟 机 的 范围 ， 因 为 装载 类 的 功 
能 是 虚拟 机 的 ， 所 以 一 个 虚拟 机 在 通过 自己 的 ClassLoad[5] 装 载 实 现 单 
例 类 的 时 候 就 会 创建 一 个 类 的 实例 。 在 Java 语 言 中 ， 这 样 的 行为 能 带 来 
两 大 好 处 : 

(1) 对 于 频繁 使 用 的 对 象 ， 可 以 省 略 创建 对 象 所 花费 的 时 间 ， 这 
对 于 那些 重量 级 对 象 而 言 ， 是 非常 可 观 的 一 笔 系 统 开销 。 

(2) 由 于 new 操 作 的 次 数 减少 ， 因 而 对 系统 内 存 的 使 用 频率 也 会 
降低 ， 这 将 减轻 GC 压力 ， 缩 短 GC 停 顿时 间 。 

因此 对 于 系统 的 关键 组 件 和 被 频繁 使 用 的 对 象 ， 使 用 单 例 模式 可 
以 有 效 地 改善 系统 的 性 能 。 单 例 模 式 的 核心 在 于 通过 一 个 接口 返回 唯 
一 的 对 象 实例 。 首 要 的 问题 就 是 要 把 创建 实例 的 权限 收回 来 ， 让 类 自 
身 来 负责 自己 类 的 实例 的 创建 工作 ， 然 后 由 这 个 类 来 提供 外 部 可 以 访 
问 这 个 类 实例 的 方法 ， 代 码 如 代码 清单 4-14 所 示 。 


代码 清单 4-14 单 例 模式 基本 实现 

public class Singleton { 

private Singleton () { 

System.out.println("Singleton is create"); 

} 

private static Singleton instance = new Singleton(); 
public static Singleton getInsatnce() { 

return instance; 

} 
} 


上 述 代 码 唯 一 的 不 足 是 无 法 对 instance 实 例 做 延 时 加 载 ， 例 如 单 例 
的 创建 过 程 很 慢 ， 而 由 于 instance 成 员 变量 是 static 定 义 的 ， 因 此 在 JVM 
加 载 单 例 类 时 ， 单 例 对 象 就 会 被 建立 ， 如 果 此 时 这 个 单 例 类 在 系统 中 
还 扮演 其 他 角色 ， 那 么 在 任何 使 用 这 个 单 例 类 的 地 方 都 会 初始 化 这 个 
单 例 变 量 ， 而 不 管 是 否 会 被 用 到 ， 代 码 如 代码 清单 4-15 所 示 。 


代码 清单 4-15 单 例 模式 实验 

public class Singleton { 

private Singleton () { 
System.out.println("Singleton is create"); 

} 

private static Singleton instance = new Singleton(); 
public static Singleton getInsatnce() { 

return instance; 

} 

public static void createString() { 
System.out.println("createString in Singleton"); 


} 


public static void main(String[] args) { 
Singleton.createString(); 

} 

} 


可 以 看 到 ， 虽 然 此 时 并 没有 使 用 单 例 类 ， 但 它 还 是 被 创建 出 来 ， 
为 了 解决 这 类 问题 ， 需 要 引入 延迟 加 载 机 制 ， 如 代码 清单 4-16 所 示 。 


代码 清单 -16 延迟 加 载 的 单 例 模式 代码 
public class LazySingleton { 
private LazySingleton() { 
System.out.println("LazySingleton is create"); 
} 
private static LazySingleton instance = null; 
public static synchronized LazySingleton getInstance() { 
if(instance == null) { 
instance = new LazySingleton(); 


} 


return instance; 

} 

public static void createString() { 
System.out.println("create String") ; 

} 

public static void main(String[] args) { 
LazySingleton.createString(); 

} 
} 


代码 清单 4-16 所 示人 代码 首 先 对 于 静态 成 员 变 量 instance 初 始 化 赋值 
nul， 确 保 系统 启动 时 没有 额外 的 负载 ; 其 次 ， 在 getInstance () 工厂 
万 法 中 ， 判 断 当 前 单 例 是 否 已 经 存在 ， 若 存在 则 返回 ， 不 存在 则 再 建 
立 单 例 。 这 里 尤其 要 注意 的 是 ，getInstance () 方法 必须 是 同步 的 ， 否 
则 在 多 线程 环境 下 ， 当 线程 1 正 新 建 单 例 时 ， 完 成 赋值 操作 前 ， 线 程 2 
可 能 判断 instance 为 null， 故 线程 2 也 将 启动 新 建 单 例 的 程序 ， 而 导致 多 
个 实例 被 创建 ， 故 同步 关键 字 是 必需 的 。 由 于 引入 了 同步 关键 字 ， 导 
致 多 线程 环境 下 耗 时 明显 增加 。 


为 了 解决 同步 关键 字 降 低 系统 性 能 的 缺陷 ， 做 了 一 定 改 进 ， 如 代 
码 清单 4-17 所 示 。 


代码 清单 4-17 解决 同步 关键 字 低 效率 
public class StaticSingleton { 
private StaticSingleton () { 
System.out.println("StaticSingleton is create"); 
} 
private static class SingletonHolder{ 
private static StaticSingleton instance = new StaticSingleton(); 
} 
public static StaticSingleton getInstance () { 
return SingletonHolder. instance; 
} 
} 


代码 清单 4-17 的 单 例 模式 使 用 内 部 类 来 维护 单 例 的 实例 ， 当 
StaticSingleton 被 加 载 时 ， 其 内 部 类 并 不 会 被 初始 化 ， 故 可 以 确保 当 
StaticSingleton 类 被 载 入 JVM 时 ， 不 会 初始 化 单 例 类 ， 而 当 getInstance 

0 方法 调用 时 ， 才 会 加 载 SingletonHolder， 从 而 初始 化 instance。 同 
时 ， 由 于 实例 的 建立 是 在 类 加 载 时 完成 ， 故 天 生 对 多 线程 友好 ， 
getInstance () 方法 也 无 须 使 用 同步 关键 字 。 单 例 模式 涉及 多 线程 的 相 
关 知 识 请 参见 第 5 章 。 


4.2.3 并 行程 序 设计 模式 


并 行程 序 设计 模式 一 般 有 Future 模 式 、Master-Slave 模 式 、 保 护 暂 
停 模 式 、 不 变 模 式 、 生 产 者 /消费 者 模式 等 。 

1.Future 模 式 

Future 模 式 有 点 类 似 商品 订单 。 比 如 在 进行 网 上 购物 时 ， 当 看 中 某 
一 件 商品 时 ， 就 可 以 提交 订单 。 当 订单 处 理 完 毕 后 ， 便 可 在 家 里 等 待 
商品 送 货 上 门 。 卖 家 根据 订单 从 仓库 里 取 货 ， 并 配送 到 客户 手 上 。 在 
大 部 分 情况 下 ， 商 家 对 订单 的 处 理 并 不 那么 快 ， 有 时 甚至 需要 几 天 时 


间 。 而 在 这 段 时 间 内 ， 客 户 不 需要 在 家 里 等 待 ， 而 可 以 去 处 理 其 他 事 
务 。 

将 此 例 类 推 到 程序 设计 中 ， 当 某 一 段 程序 提交 了 一 个 请 求 ， 期 望 
得 到 一 个 答复 。 但 非常 不 乎 的 是 ， 服 务 程序 对 这 个 请 求 的 处 理 可 能 很 
慢 ， 比 如 ， 这 个 请 求 可 能 是 通过 互联 网 、HTTP 或 者 Web Service 等 并 不 
太 高 效 的 方式 调用 的 。 在 传统 的 单线 程 环境 下 ， 调 用 函数 是 同步 的 ， 
也 就 是 说 它 必须 等 到 服务 程序 返回 结果 后 ， 才 能 进行 其 他 处 理 。 而 在 
Future 模 式 下 ， 调 用 方式 改 为 异步 ， 而 原先 等 待 返回 的 时 间 段 ， 在 主 调 
用 函数 中 ， 则 可 用 于 处 理 其 他 事务 。 虽 然 call 本 身 仍然 需要 很 长 一 段 时 
间 来 处 理 程序 ， 但 是 ， 服 务 程序 不 等 数据 处 理 完成 便 立 即 返 回 客 户 端 
一 个 伪造 的 数据 (相当 于 商品 的 订单 ， 而 不 是 商品 本 身 ) ， 实 现 了 
Future 模 式 的 客户 端 在 拿 到 这 个 返回 结果 后 ， 并 不 急于 对 其 进行 处 理 ， 
而 去 调用 了 其 他 业务 逻辑 ， 充 分 利用 了 等 待 时 间 ， 这 就 是 Future 模 式 的 
核心 所 在 。 在 完成 了 其 他 业务 逻辑 的 处 理 后 ， 最 后 再 使 用 返回 比较 慢 
的 Future 数 据 。 这 样 ， 在 整个 调用 过 程 中 ， 就 不 存在 无 谓 的 等 待 ， 充 分 
利用 了 所 有 的 时 间 片 段 ， 从 而 提高 系统 的 响应 速度 。 

Future 模 式 的 主要 参与 者 包括 : 

m Main 一 系统 启动 ， 调 用 Client 发 出 请 求 ; 

m Client 一 返回 Data 对 象 ， 立 即 返 回 FutureData， 并 开启 
ClientThread 线 程 装 配 RealData; 

m Data 一 返回 数据 的 接口 ; 

m FutureData 一 Future 数 据 ， 构 造 很 快 ， 但 是 是 一 个 虚拟 的 数据 ， 
需要 装配 RealData ; 

m RealData 一 真实 数据 ， 其 构造 是 比较 慢 的 。 


代码 清单 418 Future 模式 示例 


/* 
* Main 函数 主要 负责 调用 Client 发 起 请 求 ， 并 使 用 返回 的 数据 
&J 


public class FutureMain { 
public static void main(String[] args) { 

Client client = new Client(); 

/ /这 里 会 立即 返回 ， 因 为 得 到 的 是 FutureData 而 不 是 RealData 

Data data = client.request ("name") ; 

System.out,println ("虚拟 请 求 结束 ") ; 

try{ 
// 这 里 可 以 用 一 个 Sleep 代替 对 其 他 业务 罗 辑 的 处 理 ， 在 实际 场 是 中 ，RealData 被 创建 ， 

节约 了 等 待 时 间 

Thread.sleep (1000) ; 

}catch(InterruptedException ex) { 
ex.printStackTrace () ; 

} 

// 使 用 真实 数据 

System.out.println(data.getResult); 


2.Master-Slave 模 式 

Master-Slave ( 主 从 ) 模式 主导 的 系统 架构 一 般 由 两 类 线程 实现 ， 
Master 线 程 负责 接收 和 分 发 任务 (将 任务 拆 成 一 个 个 子 任务 ) ，Worker 
线程 负责 处 理子 任务 ， 每 个 Worker 线 程 只 处 理 部 分 任务 ， 所 有 Worker 
线程 共同 完成 所 有 任务 的 处 理 。 

该 模式 的 好 处 在 于 能 够 将 一 个 大 的 任务 拆 分 成 若干 个 小 的 任务 ， 
从 而 交 给 不 同 的 worker 并 行 的 进行 处 理 ， 进 而 提高 系统 的 吞吐 量 。 另 


外 ，Client 端 一 旦 提交 任务 后 ，Master 线 程 完成 任务 的 接收 和 分 发 后 立 
即 返 回 ， 因 此 对 客户 端 来 说 ， 整 个 过 程 也 是 异步 进行 的 。 
一 般 的 实现 思路 如 下 : 

(1) Master 中 首先 需要 维护 一 个 队列 Queue， 用 于 接收 任务 ， 同 
时 维护 一 个 所 有 Worker 线 程 的 hreadMap ， 以 及 每 个 子 任务 对 应 的 处 理 
结果 集 resultMap ， 这 里 由 于 涉及 多 线程 同时 访问 resultMap ， 因 此 一 般 
使 用 JDK 中 的 ConcurrentHashMap 实 现 ; 

(2) Worker 线 程 实现 Runnable 或 继承 Thread ， 通 过 Master 中 的 
Queue 获 取 拆 分 后 的 子 任务 ， 并 进行 业务 处 理 ， 并 将 处 理 结果 设置 到 
resultMap 中 以 便 Master 获 取 到 5 

(3) Main 入 口 函 数 则 负责 客户 端 请 求 的 提交 (需要 先进 程 拆 
解 ) ， 以 及 通过 Master 获 取 各 个 Worker 的 结果 后 进行 合并 ， 最 后 返回 给 
客户 端 完成 处 理 过 程 。 

目前 主流 的 MapReduce 框 架 、 集 群 框架 很 多 都 是 来 用 该 种 模式 架构 
实现 的 。 

3. 保 护 暂 停 (Guarded Suspension) 模式 

所 谓 “ 保 护 暂 停 > 模 式 ， 核 心思 想 在 于 仅 当 服务 进程 准备 好 时 ， 才 
提供 服务 。 它 的 好 处 在 于 既 能 保证 所 有 的 客户 端 请 求 均 不 丢失 ， 同 时 
也 避免 了 服务 器 由 于 同时 处 理 太 多 的 请 求 而 骨 溃 的 现象 ， 有 效 降 低 系 
统 的 瞬时 负载 ， 有 助 于 系统 稳定 性 。 
其 实 这 种 通过 中 间 加 一 层 Queue 做 缓冲 的 模式 在 工作 中 用 的 很 
类 似 “ClientThread- > Request Queue- > ServerThread” 的 情况 比比 此 
， 只 不 过 可 能 实际 中 我 们 往往 会 结合 其 他 方法 一 起 使 用 ， 例 如 : 

(1) 将 ClientThread 和 ServerThread 均 为 多 个 ， 则 变 为 经 典 的 “生产 

者 -消费 者 ”模式 ; 

(2) 如 果 将 ServerThread 拆 为 1 个 Master 和 多 个 Worker， 则 又 是 上 
面 提 到 的 “Master-Worker” 模 式 ; 

(3) 如 果 处 理 的 请 求 需要 返回 结果 ， 那 么 又 需要 和 FutureTask 结 
合 起 来 使 用 ( 即 客户 端的 请 求 中 需要 带 上 FutureData ， 并 在 
ServerThread 中 为 FutureData 设 置 上 RealData) 。 

4. 不 变 模式 


各 R 


并 发 多 线程 程序 中 ， 当 多 线程 对 同一 个 对 象 进行 读 写 操 作 时 ， 为 
了 确保 对 象 数据 的 一 致 性 和 准确 性 ， 必 须 进行 同步 操作 ， 而 这 正 是 对 
系统 性 能 损失 严重 的 地 方 。 因 此 ， 为 了 提高 并 发 程序 的 性 能 ， 我 们 可 
以 创建 一 种 不 可 改变 的 对 象 ， 使 用 过 程 中 保持 不 变性 。 这 就 是 所 谓 “ 不 
变 ” 模 式 。Java 中 这 种 模式 用 的 很 广 ， 如 String、Boolean、 Short, 
Integer、Long、Byte 等 。 它 的 好 处 在 于 通过 回避 问题 而 不 是 解决 问题 的 
态度 来 处 理 多 线程 并 发 访问 控制 ， 但 缺点 是 只 适用 于 对 象 创建 后 内 部 
状态 和 数据 不 可 发 生变 化 的 情况 。 

Java 中 不 变 模式 的 实现 很 简单 ， 按 照 OO 的 思想 [6]， 只 需要 满足 以 
下 几 点 即 可 : 

(1) 将 对 象 的 所 有 属性 设 为 private final 的 ; 

(2) 通过 final 修 饰 class 确 保 类 不 可 被 继承 ; 

(3) 去 掉 对 象 中 的 所 有 settXX 方 法 ; 

(4) 有 包含 所 有 属性 的 构造 施 数 用 于 创建 对 象 。 

5. 生 产 者 -消费 者 模式 

生产 者 线程 向 内 存 缓冲 区 提交 任务 ， 消 费 者 线程 从 内 存 缓冲 区 获 
取 任 务 并 进行 处 理 。 它 的 好 处 在 于 将 生产 者 线程 和 消费 者 线程 进行 解 
耦 ， 优 化 系统 整体 结构 ， 缓 解 性 能 瓶颈 对 系统 性 能 的 影响 。 

Java 中 ， 一 般 来 说 使 用 LinkedBlockingQueue 作 为 上 面 说 的 “内 存 组 
冲 区 ”， 它 是 阻塞 型 BlockingQueue 的 一 种 使 用 Link List 的 实现 ， 它 对 头 
和 尾 采 用 两 把 不 同 的 锁 ， 与 ArrayBlockingQueue 相 比 提 高 了 吞吐 量 ， 适 
合 于 实现 “生产 者 -消费 者 模式。 实现 的 大 致 思路 如 下 : 

(1) 创建 Producer 类 ， 实 现 run 方 法 用 于 提交 任务 ; 

(2) 创建 Consumer 类 ， 实 现 run 方 法 用 于 处 理 任务 ; 

(3) Main 函 数 中 建立 缓冲 区 ， 若 干 个 生产 者 ， 若 干 个 消费 者 ， 创 
建 线程 池 并 开始 使 这 些 线程 工作 起 来 。 

关于 这 一 部 分 内 容 ， 我 们 在 第 5 章 会 有 详细 的 解释 。 


4.2.4 接口 适 配 


中 国 古 代 最 初 盛 行道 教 ， 后 世 逐 渐 传 播 的 佛教 由 唐 代 著 名 高 僧 、 
法 相 守 创始 人 去 装 西 渡 而 得 。 三 藏 法 师 为 了 探究 佛教 各 派 学 说 分 歧 ， 
于 贞观 元 年 一 人 西行 五 万 里 ， 历 经 艰 平 到 达 印 度 佛教 中 心 那 烂 陀 夺取 
真 经 。 前 后 十 七 年 学 遍 了 当时 的 大 小 乘 各 种 学 说 ， 共 带 回 佛 舍利 150 
粒 、 佛 像 7 尊 、 经 论 657 部 ， 并 长 期 从 事 翻 译 佛经 的 工作 。 玄 装 及 其 第 
子 共 译 出 佛 典 75 部 、1335 卷 。 云 装 的 译 典 闭 作 有 【《 大 般若 经 》《 心 
经 》《 解 深 密 经 》 《瑜伽 师 地 论 》 《成 唯 识 论 》 等 。《 大 唐 西 域 记 》 
十 二 卷 ， 记 述 他 西游 亲身 经 历 的 110 个 国家 及 传闻 的 28 个 国家 的 山川 、 
地 邑 、 物 产 、 习 俗 等 。 《西游 记 》 即 以 其 取经 事迹 为 原型 。 芯 装 由 于 
其 爱国 及 护持 佛法 的 精神 和 巨大 贡献 ， 被 誉 为 "中华 民族 的 脊梁 "”， 他 
以 无 我 无 人 无 众生 无 寿 者 相 ， 不 畏 生 死 的 精神 ， 西 行 取 佛经 ， 体 现 了 
大 乘 佛法 著 萨 ， 渡 化 众生 的 真实 事迹 。 他 的 足迹 遍布 印度 ， 影 响 远 至 
日 本 、 韩 国 以 至 全 世界 。 他 的 思想 与 精神 如 今 已 是 中 国 、 亚 洲 乃 至 世 
界 人 民 的 共同 财富 。 正 是 由 于 有 三 藏 法 师 这 样 的 翻译 者 ， 中 国 国 内 才 
会 逐渐 盛行 佛教 ， 这 也 是 今天 我 们 这 一 章 的 主题 “适配器 模式 ”。 

著名 的 设计 模式 “四 人 帮 ” (Gang of Four) 这 样 评价 适配器 模式 : 

将 一 个 类 的 接口 转换 成 客户 希望 的 另外 一 个 接口 。Adapter 模 式 使 
得 原本 由 于 接口 不 兼容 而 不 能 一 起 工作 的 那些 类 可 以 一 起 工作 。 

适配器 模式 将 一 个 类 的 接口 适 配 成 用 户 所 期 竺 的。 一 个 适配器 通 
常人 允许 因为 接口 不 兼容 而 不 能 一 起 工作 的 类 能 够 在 一 起 工作 ， 做 法 是 
将 类 自己 的 接口 包 右 在 一 个 已 存在 的 类 中 。 

Adapter 设 计 模 式 主要 目的 组 合 两 个 不 相干 类 ， 常 用 有 两 种 方法 ， 
第 一 种 解决 方案 是 修改 各 自 类 的 接口 。 但 是 如 果 没 有 源码 ， 或 者 不 愿 
意 为 了 一 个 应 用 而 修改 各 自 的 接口 ， 则 需要 使 用 Adapter 适 配器 ， 在 两 
种 接口 之 间 创 建 一 个 混合 接口 。 

如 图 4-6 所 示 是 适配器 模式 的 类 图 。 Adapter 适 配器 设计 模式 中 有 3 
个 重要 角色 : 被 适 配 者 Adaptee、 适 配器 Adapter 和 目标 对 象 Target。 其 
中 两 个 现存 的 想 要 组 合 到 一 起 的 类 分 别 是 被 适 配 者 Adaptee 和 目标 对 象 
Target 角 色 ， 按 照 类 图 所 示 ， 我 们 需要 创建 一 个 适配器 Adapter 将 其 组 合 
在 一 起 。 


«interface» 
Target 


Client 


Adapter 


图 4-6 适配器 模式 类 图 
具体 实现 代码 请 见 代 码 清 单 4-19。 


代码 清单 4-19 Pise 
/* 
* 定义 客户 端 使 用 的 接口 ， 与 业务 相关 
*/ 
public interface Target { 
/* 
* 客户 端 请 求 处 理 的 方法 
kj 
public void request () 
} 
/* 
* 已 经 存在 的 接口 ， 这 个 接口 需要 配置 
public class Adaptee { 
/* 
* 原本 存在 的 方法 
zy 
public void specificRequest () { 


// 业 务 代码 


代码 清单 4-20 ”适配器 实现 


public class Adapter implements Target( 
/* 
* 持 有 需要 被 适 配 的 接口 对 象 
private Adaptee adaptee; 
/* 
* 构造 方法 ， 传 入 需要 被 适 配 的 对 象 
* @param adaptee 需要 被 适 配 的 对 象 
i 
public Adapter(Adaptee adaptee) { 
this.adaptee - adaptee; 
) 
QOverride 
public void request() { 
// TODO Auto-generated method stub 
adaptee.specificRequest(); 


代码 清单 4-21 客户 端 代码 

/* 

* 使 用 适配器 的 客户 端 

ef 

public class Client ( 

public static void main(String[] args) { 

/ /创建 需要 被 适 配 的 对 象 
Adaptee adaptee = new Adaptee(); 
/ /创建 客户 端 需要 调用 的 接口 对 象 
Target target = new Adapter (adaptee); 
/ /请求 处 理 


target.request(); 


以 下 情况 比较 适合 使 用 Adapter 模 式 : 
x (1) 当 你 想 使 用 一 个 已 经 存在 的 类 ， 而 它 的 接口 不 符合 你 的 需 

(2) 你 想 创建 一 个 可 以 复 用 的 类 ， 该 类 可 以 与 其 他 不 相关 的 类 或 
不 可 预见 的 类 协同 工作 ; 

(3) 你 想 使 用 一 些 已 经 存在 的 子 类 ， 但 是 不 可 能 对 每 一 个 都 进行 
子 类 化 以 匹配 它们 的 接口 ， 对 象 适配器 可 以 适 配 它 的 父亲 接口 。 

适配器 模式 使 用 示例 代码 

考虑 一 个 记录 日 志 的 应 用 ， 用 户 可 能 会 提出 要 求 采用 文件 的 方式 
存储 日 志 ， 也 可 能 会 提出 存储 日 志 到 数据 库 的 需求 ， 这 样 我们 可 以 采 
用 适配器 模式 对 旧 的 日 志 类 进行 改造 ， 提 供 新 的 支持 方式 。 

首先 我 们 需要 一 个 简单 的 日 志 对 象 类 ， 如 代码 清单 4-22 所 示 。 


代码 清单 4-22 日志 对 象 类 
/* 
* 日志 数据 对 象 
n 
public class LogBean { 
private String logId;//H ŠA} 
private String opeUserId;// 操 作 人 员 


public String getLogId(){ 
return logld; 

} 

public void setLogId(String logId) { 
this.logId = logId; 


public String getOpeUserId()| 
return opeUserId; 
} 
public void setOpeUserId(String opeUser1d) { 
this.opeUserId = opeUserId; 
} 
public String toString () { 
return "logId-"4logId*",opeUserId-"*opeUserId; 
} 
} 


接 下 来 定义 一 个 操作 日 志文 件 的 接口 ， 如 代码 清单 4-23 所 示 。 


代码 清单 4-23 操作 日 志 接口 


import java.util.List; 


/* 
* 读 取 日 志文 件 ， 从 文件 里 面 获取 存储 的 日 志 列 表 对 象 
* (return 存储 的 日 志 列 表 对 象 
| 
public interface LogFileOperateApi { 
public List<LogBean> readLogFile() ; 
/** 
* 写 日 志文 件 ， 把 日 志 列 表 写 出 到 日 志文 件 中 去 
* @param list 要 写 到 日 志文 件 的 日 志 列 表 
public void writeLogFile(List<LogBean> list); 
} 


然后 实现 日 志文 件 的 存储 和 获取 ， 这 里 忽略 业务 代码 ， 如 代码 清 
单 4-24 所 示 。 


代码 清单 4-24 ”实现 对 日 志文 件 的 获取 
import java.io.File; 
import java.io.ObjectInputStream; 
import java.io.ObjectOutputStream; 


import java.util.List; 


/* 
* 实现 对 日 志文 件 的 操作 
public class LogFileOperate implements LogFileOperateApi { 
/* 
* 设置 日 志文 件 的 路 径 和 文件 名 称 
*/ 
private String logFileName - "file.log"; 
/* 
* 构造 方法 ， 传 入 文件 的 路 径 和 名 称 
*/ 


public LogFileOperate(String logFilename) { 
if (logFilename!-null)( 


this.logFileName = logFilename; 


@Override 

public List<LogBean> readLogFile() { 
// TODO Auto-generated method stub 
List<LogBean> list = null; 
ObjectInputStream oin -null; 
/ /业务 代 码 


return list; 


QOverride 

public void writeLogFile(List<LogBean> list) { 
// TODO Auto-generated method stub 
File file - new File(logFileName); 
ObjectOutputStream oout = null; 
/ /业务 代码 


如 果 这 时 候 需 要 引入 数据 库 方式 ， 引 入 适配器 之 前 ， 我 们 需要 定 
义 日 志 管 理 的 操作 接口 ， 如 代码 清单 4-25 所 示 。 


代码 清单 4-25 定义 数据 库 操作 接口 
public interface LogDbOpeApi { 
/* 
* 新 增 日 志 
* (param 需要 新 增 的 日 志 对 象 
my 
public void createLog(LogBean logbean); 
} 
接 下 来 就 要 实现 适配器 了 ，LogDbOpeApi 接 口 就 相当 于 Target 接 
口 ，LogFileOperate 就 相当 于 Adaptee 类 。Adapter 类 代码 如 代码 清单 4-26 


所 示 。 


代码 清单 4-26 Adapter 类 实现 


import java.util.List; 


/* 
* 适配器 对 象 ， 将 记录 日 志 到 文件 的 功能 适 配 成 数据 库 功 能 
*/ 


public class LogAdapter implements LogDbOpeApi { 

private LogFileOperateApi adaptee; 

public LogAdapter (LogFileOperateApi adaptee) { 
this.adaptee = adaptee; 

} 

@Override 

public void createLog(LogBean logbean) { 
// TODO Auto-generated method stub 
List<LogBean> list = adaptee.readLogFile(); 
list.add(logbean); 
adaptee.writeLogFile (list); 


} 
最 后 是 客户 端 代 码 的 实现 ， 如 代码 清单 4-27 所 示 。 


代码 清单 4-27 客户 端 类 实现 
import java.util.Arraylist; 


import java.util.List; 


public class LogClient { 
public static void main(String[] args) { 
LogBean logbean = new LogBean(); 
logbean.setLogId("1"); 
logbean.setOpeUserId ("michael"); 


List<LogBean> list = new ArrayList«LogBean»(); 


LogFileOperateApi logFileApi = new LogFileOperate(""); 
/1 创建 操作 日 志 的 接口 对 象 
LogDbOpeApi api = new LogAdapter (logFileApi); 


api.createLog (logbean); 


} 
JDK 中 有 大 量 使 用 适配器 模式 的 案例 ， 代 码 清单 4-28 大 致 列举 了 一 


些 类 。 


代码 清单 4-28 使 用 适配器 模式 的 类 
java.util.Arrays#asList () 
javax.swing.JTable (TableModel) 

java.io. InputStreamReader (InputStream) 
java.io.OutputStreamWriter (OutputStream) 


javax.xml.bind.annotation.adapters.XmlAdapterfmarshal () 


javax.xml.bind.annotation.adapters.XmlAdapter#unmarshal () 


JDK1.1 Z Bj te fH AY & 28 Arrays, Vector, Stack, Hashtable, 
Properties、BitSet， 其 中 定义 了 一 种 访问 群集 内 各 元 素 的 标准 方式 ， 称 
为 Enumeration (列举 器 ) 接口 ， 用 法 如 代码 清单 4-29 所 示 。 


代码 清单 4.29 Enumeration 接口 实现 方式 
Vector v-new Vector(); 
for (Enumeration enum -v.elements(); enum.hasMoreElements();) ( 
Object o = enum.nextElement () ; 
processObject (0) ; 


} 


JDK1.2 版 本 中 引入 了 Tterator 接 口 ， 新 版 本 的 集合 对 象 (HashSet、 
HashMap 、 WeakHeahMap 、 ArrayList ~ TreeSet ~ TreeMap 、 
LinkedList) 是 通过 Tterator 接 口 访问 集合 元 素 的 ， 用 法 如 代码 清单 4-30 
所 示 。 


代码 清单 4-30 Iterator 接口 实现 方式 
List list=new ArrayList(); 
for (Iterator it-list.iterator();it.hasNext();) 
{ 
System.out.println(it.next()); 
} 


这 样 ， 如 果 将 老 版 本 的 程序 运行 在 新 的 Java 编 译 器 上 就 会 出 错 。 
为 List 接 口中 已 经 没有 elements () ， 而 只 有 iterator () 了 。 那 么 如 何 
可 以 使 老 版 本 的 程序 运行 在 新 的 Java 编 译 器 上 呢 ? 如 果 不 加 修改 ， 是 肯 
定 不 行 的 ， 但 是 修改 要 遵循 “ 开 - 闭 ”原则 。 我 们 可 以 用 Java 设 计 模式 中 
的 适配器 模式 解决 这 个 问题 。 代 码 清单 4-31 所 示 是 解决 方法 代码 。 


代码 清单 4-31 采用 适配器 模式 
import java.util.ArrayList; 
import java.util.Enumeration; 
import java.util.Iterator; 


import java.util.List; 


public class NewEnumeration implements Enumeration 


{ 


Iterator it; 
public NewEnumeration (Iterator it) 
{ 
this.it=it; 
// TODO Auto-generated constructor stub 


public boolean hasMoreElements () 
{ 
// TODO Auto-generated method stub 


return it.hasNext (); 


public Object nextElement () 

{ 
// TODO Auto-generated method stub 
return it.next(); 

} 

public static void main(String[] args) 

{ 
List list=new ArrayList (); 
list.add("a"); 

list.add("b") ; 

list .add("C"); 


for (Enumeration e-new NewEnumeration(list.iterator());e.hasMoreElements();) 


System. out.println(e.nextElement ()) ; 


代码 清单 4-31 所 示 的 NewEnumeration 是 一 个 适配器 类 ， 通 过 它 实 
现 了 从 Iterator 接 口 到 Enumeration 接 口 的 适 配 ， 这 样 我 们 就 可 以 使 用 老 
版 本 的 代码 来 使 用 新 的 集合 对 象 了 。 

Java IO 库 大 量 使 用 了 适配器 模式 ， 例 如 ByteArrayInputStream 是 一 
个 适配器 类 ， 它 继承 了 InputStream 的 接口 ， 并 且 封 装 了 一 个 byte 数 组 。 
换言之 ， 它 将 一 个 byte 数 组 的 接口 适 配 成 InputStream 流 处 理 器 的 接口 。 

我 们 知道 Java 语 言 支持 四 种 类 型 : Java 接 口 、Java 类 、Java 数 组 、 
原始 类 型 〈 即 int、float 等 ) 。 前 三 种 是 引用 类 型 ， 类 和 数组 的 实例 是 
对 象 ， 原 始 类 型 的 值 不 是 对 象 。 也 即 ，Java 语 言 的 数组 是 像 所 有 的 其 他 
对 象 一 样 的 对 象 ， 而 不 管 数 组 中 所 存储 的 元 素 类 型 是 什么 。 这 样 一 来 
的 话 ，ByteArrayInputStream 就 符合 适配器 模式 的 描述 ， 是 一 个 对 象形 
式 的 适配器 类 。FileInputStream 是 一 个 适配器 类 。 在 FileInputStream 继 
承 了 InputStrem 类 型 ， 同 时 持 有 一 个 对 FileDiscriptor 的 引用 。 这 是 将 一 
个 FileDiscriptor 对 象 适 配 成 InputStrem 类 型 的 对 象形 式 的 适配器 模式 。 
查看 JDK1.4 的 源 代码 我 们 可 以 看 到 代码 清单 4-20 所 示 的 FileInputStream 
类 的 源 代码 。 


代码 清单 4-32 FilelnputStream 类 
Public classFileInputStream extends InputStream | 
/* File Descriptor - handle to the open file */ 
private FileDescriptor fd; 
public FileInputStream(FileDescriptor fdobj) { 
SecurityManager security = System.getSecurityManager (); 
if (fd0bj == null) { 
throw new NullPointerException (); 
} 
if (security != null) { 
security.checkRead(fd0bj);}fd = fd0bj; 
} 
public FileInputStream(File file) throws FileNotFoundException { 
String name = file.getPath(); 
SecurityManager security = System.getSecurityManager () ; 
if (security != null) { 
security.checkRead (name) ; 
} 
fd = new FileDescriptor(); 
open (name) ; 
} 
// 其 他 代码 
} 
} 


同样 ， 在 OutputStream 类 型 中 ， 所 有 的 原始 流 处 理 器 都 是 适配器 
类 。ByteArrayOutputStream 继 承 了 OutputStream 类 型 ， 同 时 持 有 一 个 对 
byte 数 组 的 引用 。 它 一 个 byte 数 组 的 接口 适 配 成 OutputString 类 型 的 接 
口 ， 因 此 也 是 一 个 对 象形 式 的 适配器 模式 的 应 用 。 

FileOutputStream 继承 了 OutputStream 类 型 ， 同 时 持 有 一 个 对 
FileDiscriptor 对 象 的 引用 。 这 是 一 个 将 FileDiscriptor 接 口 适 配 成 
OutputStream 接 口 形式 的 对 象形 适配器 模式 。 


Reader 类 型 的 原始 流 处 理 器 都 是 适配器 模式 的 应 用 。StringReader 
是 一 个 适配器 类 ，StringReader 类 继承 了 Reader 类 型 ， 持 有 一 个 对 String 
对 象 的 引用 。 它 将 String 的 接口 适 配 成 Reader 类 型 的 接口 。 

Spring 中 使 用 适配器 模式 的 典型 应 用 

在 Spring 的 AOP 里 通过 使 用 的 Advice (通知 ) 来 增强 被 代理 类 的 功 
能 。Spring 实 现 这 一 AOP 功 能 的 原理 就 使 用 代理 模式 (DJDK 动 态 代理 。 
(DCGLib 字 节 码 生成 技术 代理 。) 对 类 进行 方法 级 别 的 切面 增强 ， 即 ， 
生成 被 代理 类 的 代理 类 ， 并 在 代理 类 的 方法 前 ， 设 置 拦 截 器 ， 通 过 执 
行 拦 截 器 重 的 内 容 增强 了 代理 方法 的 功能 ， 实 现 的 面向 切面 编程 。 

Advice (通知 ) 的 类 型 有 : BeforeAdvice、AfterReturningAdvice、 
ThrowSadvice 等 。 每 个 类 型 Advice (通知 ) 都 有 对 应 的 拦截 器 ， 
MethodBeforeAdviceInterceptor ~ AfterReturningAdviceInterceptor 、 
ThrowsAdviceInterceptor。 Spring 需要 将 每 个 Advice (通知 ) 都 封装 成 对 
应 的 拦截 器 类 型 ， 返 回 给 容器 ， 所 以 需要 使 用 适配器 模式 对 Advice 进 
行 转换 。 具 体 代 码 如 代码 清单 4-33 所 示 。 


代码 清单 4-33 MethodBeforeAdvice 类 
public interface MethodBeforeAdvice extends BeforeAdvice { 
void before(Method method, Object[] args, Object target) throws Throwable; 
} 
public interface MethodBeforeAdvice extends BeforeAdvice { 
void before (Method method, Object[] args, Object target) throws Throwable; 


代码 清单 4-34 Adapter 类 接口 
public interface AdvisorAdapter { 
boolean supportsAdvice(Advice advice); 


MethodInterceptor getInterceptor (Advisor advisor); 


} 
public interface AdvisorAdapter { 


boolean supportsAdvice (Advice advice); 


MethodInterceptor getInterceptor (Advisor advisor); 


代码 清单 4-35 MethodBeforeAdviceAdapter 类 


class MethodBeforeAdviceAdapter implements AdvisorAdapter, Serializable { 


public boolean supportsAdvice(Advice advice) { 


return (advice instanceof MethodBeforeAdvice); 


public MethodInterceptor getInterceptor (Advisor advisor) { 
MethodBeforeAdvice advice - (MethodBeforeAdvice) advisor.getAdvice(); 


return new MethodBeforeAdviceInterceptor (advice); 


) 


class MethodBeforeAdviceAdapter implements AdvisorAdapter, Serializable { 


public boolean supportsAdvice(Advice advice) ( 
return (advice instanceof MethodBeforeAdvice); 


public MethodInterceptor getInterceptor (Advisor advisor) { 
MethodBeforeAdvice advice = (MethodBeforeAdvice) advisor.getAdvice(); 


return new MethodBeforeAdviceInterceptor (advice); 


代码 清单 4-36 DefaultAdvisorAdapterRegistry 类 
public class DefaultAdvisorAdapterRegistry implements AdvisorAdapterRegistry, 
Serializable { 


private final List<AdvisorAdapter> adapters = new ArrayList<AdvisorAdapter> (3); 


[** 
* Create a new DefaultAdvisorAdapterRegistry, registering well-known adapters. 
wf 
public DefaultAdvisorAdapterRegistry() {// 这 里 注册 了 适配器 
registerAdvisorAdapter (new MethodBeforeAdviceAdapter()); 
registerAdvisorAdapter(new AfterReturningAdviceAdapter()); 


registerAdvisorAdapter (new ThrowsAdviceAdapter()); 


public Advisor wrap(Object adviceObject) throws UnknownAdviceTypeException ( 
if (adviceObject instanceof Advisor) { 
return (Advisor) adviceObject; 
) 
if (!(adviceObject instanceof Advice)) { 
throw new UnknownAdviceTypeException (adviceObject) ; 
) 
Advice advice = (Advice) adviceObject; 
if (advice instanceof MethodInterceptor) { 
// So well-known it doesn't even need an adapter. 
return new DefaultPointcutAdvisor (advice); 
} 
for (AdvisorAdapter adapter : this.adapters) { 
// Check that it is supported. 
if (adapter.supportsAdvice(advice)) {// 这 里 调用 了 适配器 的 方法 
return new DefaultPointcutAdvisor (advice); 


) 


throw new UnknownAdviceTypeException (advice); 


public MethodInterceptor[] getInterceptors (Advisor advisor) throws 
UnknownAdviceTypeException { 
List«MethodInterceptor» interceptors = new ArrayList«MethodInterceptor» (3); 

Advice advice = advisor.getAdvice(); 

if (advice instanceof MethodInterceptor) { 
interceptors.add((MethodInterceptor) advice); 

) 

for (AdvisorAdapter adapter : this.adapters) ( 
if (adapter.supportsAdvice(advice)) {// 这 里 调用 了 适配器 的 方法 

interceptors.add(adapter.getInterceptor (advisor) ); 


} 
if (interceptors.isEmpty()) { 
throw new UnknownAdviceTypeException (advisor.getAdvice()); 


} 


return interceptors.toArray(new MethodInterceptor[interceptors.size()]); 


public void registerAdvisorAdapter (AdvisorAdapter adapter) { 
this.adapters.add (adapter); 


| 


双向 适配器 

适配器 也 可 以 实现 双向 的 适 配 ， 前 面 所 讲 的 都 是 把 Adaptee 适 配 成 
为 Target， 其 实 也 可 以 把 Target 适 配 成 为 Adaptee。 也 就 是 说 这 个 适配器 
可 以 同时 当 作 Target 和 Adaptee 来 使 用 。 


代码 清单 4-37 TwiceAdapter 类 


import java.util.List; 


/* 
* 双向 适配器 对 象 案例 
dli 


public class TwiceAdapter implements LogDbOpeApi,LogFileOperateApi { 


/* 

* 持 有 需要 被 适 配 的 文件 存储 日 志 的 接口 对 象 
ui 

private LogFileOperateApi fileLog; 
/* 

* 持 有 需要 被 适 配 的 DB 存储 日 志 的 接口 对 象 
+ 

private LogDbOpeApi dbLog; 


public TwiceAdapter (LogFileOperateApi fileLog,LogDbOpeApi dbLog) { 
this.fileLog = fileLog; 
this.dbLog = dbLog; 

} 

@Override 

public List<LogBean> readLogFile() { 
// TODO Auto-generated method stub 


return null; 


@Override 
public void writeLogFile(List<LogBean> list) { 
// TODO Auto-generated method stub 


} 


QOverride 

public void createLog(LogBean logbean) ( 
// TODO Auto-generated method stub 
List<LogBean> list = fileLog.readLogFile(); 
list.add(logbean); 
fileLog.writeLogFile (list); 


} 

双向 适配器 同时 实现 了 Target 和 Adaptee 的 接口 ， 使 得 双向 适配器 可 
以 在 Target 或 Adaptee 被 使 用 的 地 方 使 用 ， 以 提供 对 所 有 客户 的 透明 性 。 
尤其 在 两 个 不 同 的 客户 需要 用 不 同 的 地 方 查看 同一 个 对 象 时 ， 适 合 使 
用 双向 适配器 。 

对 象 适配器 和 类 适配器 

在 标准 的 适配器 模式 里 面 ， 根 据 适 配器 的 实现 方式 ， 把 适配器 分 
成 对 象 适配器 和 类 适配器 。 

对 象 适配器 

依赖 于 对 象 的 组 合 ， 都 是 采用 对 象 组 合 的 方式 ， 也 就 是 对 象 适 配 
器 实现 的 方式 。 

类 适配器 

采用 多 重 继承 对 一 个 接口 与 另 一 个 接口 进行 匹配 。 由 于 Java 不 支持 
多 重 继承 ， 所 以 到 目前 为 止 还 没有 涉及 。 但 可 以 通过 让 适配器 去 实现 
Target 接 口 的 方式 来 实现 。 


代码 清单 4-38 ClassAdapter 类 


import java.util.List; 


/* 
* 类 适配器 对 象 案例 
| 


public class ClassAdapter extends LogFileOperate implements LogDbOpeApi { 


public ClassAdapter (String logFilename) { 
super (logFilename) ; 


// TODO Auto-generated constructor stub 


@Override 

public void createLog(LogBean logbean) { 
// TODO Auto-generated method stub 
List<LogBean> list = this.readLogFile(); 
list.add(logbean); 
this.writeLogFile (list); 


} 
在 实现 中 ， 主 要 是 适配器 的 实现 与 以 前 不 一 样 ， 与 对 象 适配器 实 

现 同样 的 功能 相 比 ， 类 适配器 在 实现 上 有 所 改变 : 

(1) 需要 继承 LogFileOperate 的 实现 ， 然 后 再 实现 LogDbOpeApi 接 
Ho 

(2) 需要 按照 继承 LogFileOperate 的 要 求 ， 提 供 传 入 文件 路 径 和 名 
称 的 构造 方法 。 

(3) 不 再 需要 持 有 LogFileOperate 的 对 象 ， 因 为 适配器 本 身 就 是 
LogFileOperate 对 象 的 子 类 。 


(4) 以 前 调用 被 适 配 对 象 的 方法 的 地 方 ， 全 部 修改 成 调用 自己 的 
As 

类 适配器 和 对 象 适配器 的 选择 

(1) 从 实现 上 : 类 适配器 使 用 对 象 继承 的 方式 ， 属 于 静态 的 定义 
方式 。 对 象 适 配器 使 用 对 象 组 合 的 方式 ， 属 于 动态 组 合 的 方式 。 

(2) 从 工作 模式 上 : 类 适配器 直接 继承 了 Adaptee， 使 得 适配器 不 
能 和 Adaptee 的 子 类 一 起 工作 。 对 象 适 配器 允许 一 个 Adapter 和 多 个 
Adaptee， 包 括 Adaptee 和 它 所 有 的 子 类 一 起 工作 。 

(3) 从 定义 角度 : 类 适配器 可 以 重 定义 Adaptee 的 部 分 行为 ， 相 当 
于 子 类 履 盖 父 类 的 部 分 实现 方法 。 对 象 适 配器 要 重 定 义 Adaptee 很 困 
难 。 

(4) 从 开发 角度 : 类 适配器 仅仅 引入 了 一 个 对 象 ， 并 不 需要 额外 
的 引用 来 间接 得 到 Adaptee。 对 象 适配器 需要 额外 的 引用 来 间接 得 到 
Adapteeo 

总 的 来 说 ， 建 议 使 用 对 象 适 配器 方式 。 

适配器 模式 使 用 前 提 

(1) 接口 中 规定 了 所 有 要 实现 的 方法 。 

(2) 实现 此 接口 的 具体 类 ， 只 用 到 了 其 中 的 几 个 方法 ， 而 其 他 的 
方法 都 是 没有 用 的 。 

适配器 模式 实现 方法 

(1) 用 一 个 抽象 类 实现 已 有 的 接口 ， 并 实现 接口 中 所 规定 的 所 有 
方法 ， 这 些 方法 的 实现 可 以 都 是 “平庸 ”实现 一 空 方法 ; 但 此 类 中 的 方 
法 是 具体 的 方法 ， 而 不 是 抽象 方法 ， 否 则 的 话 ， 在 具体 的 子 类 中 仍 要 
实现 所 有 的 方法 ， 这 就 失去 了 适配器 本 来 的 作用 。 

(2) 原本 要 实现 接口 的 子 类 ， 只 实现 1 中 的 抽象 类 即 可 ， 并 在 其 
内 部 实现 时 ， 只 对 其 感 兴 趣 的 方法 进行 实现 。 

适配器 模式 使 用 注意 事项 

(1) 充当 适配器 角色 的 类 就 是 : 实现 已 有 接口 的 抽象 类 。 

(2) 为 什么 要 用 抽象 类 ? 此 类 是 不 要 被 实例 化 的 。 而 只 充当 适 配 
器 的 角色 ， 也 就 为 其 子 类 提供 了 一 个 共同 的 接口 ， 但 其 子 类 又 可 以 将 


精力 只 集中 在 其 感 兴趣 的 地 方 。 

(3) 适配器 模式 中 被 适 配 的 接口 Adaptee 和 适 配 成 为 的 接口 Target 
是 没有 关联 的 ，Adaptee 和 Target 中 的 方法 既 可 以 是 相同 的 ， 也 可 以 是 不 
同 的 。 

(4) 适配器 在 适 配 的 时 候 ， 可 以 适 配 多 个 Apaptee， 也 就 是 说 实现 
某 个 新 的 Target 的 功能 的 时 候 ， 需 要 调用 多 个 模块 的 功能 ， 适 配 多 个 模 
块 的 功能 才能 满足 新 接口 的 要 求 。 

(5) 适配器 有 一 个 潜在 的 问题 ， 就 是 被 适 配 的 对 象 不 再 兼容 
Adaptee 的 接口 ， 因 为 适配器 只 是 实现 了 Target 的 接口 。 这 导致 并 不 是 所 
有 Adaptee 对 象 可 以 被 使 用 的 地 方 都 能 是 使 用 适配器 ， 双 向 适配器 解决 
了 这 个 问题 。 

优点 

适配器 模式 也 是 一 种 包装 模式 ， 它 与 装饰 模式 同样 具有 包装 的 功 
能 ， 此 外 ， 对 象 适配器 模式 还 具有 委托 的 意思 。 总 的 来 说 ， 适 配器 模 
式 属于 补偿 模式 ， 专 用 来 在 系统 后 期 扩展 、 修 改 时 使 用 。 

缺点 

过 多 使 用 适配器 ， 会 让 系统 非常 零乱 ， 不 易 整 体 进行 把 握 。 比 
如 ， 明 明 看 到 调用 的 是 A 接 口 ， 其 实 内 部 被 适 配 成 了 B 接 口 的 实现 ， 一 
个 系统 如 果 太 多 出 现 这 种 情况 ， 无 异 于 一 场 灾 难 。 因 此 如 果 不 是 很 有 
必要 ， 可 以 不 使 用 适配器 ， 而 是 直接 对 系统 进行 重 构 。 

适配器 模式 应 用 场景 

在 软件 开发 中 ， 也 就 是 系统 的 数据 和 行为 都 正确 ， 但 接口 不 相符 
时 ， 我 们 应 该 考虑 用 适配器 ， 目 的 是 使 控制 范围 之 外 的 一 个 原 有 对 象 
与 某 个 接口 匹配 。 适 配器 模式 主要 应 用 于 希望 复 用 一 些 现存 的 类 ， 但 
是 接口 又 与 复 用 环境 要 求 不 一 致 的 情况 。 比 如 在 需要 对 早期 代码 复 用 
一 些 功 能 等 应 用 上 很 有 实际 价值 。 适 用 场景 大 臻 包含 三 类 : 

(1) 已 经 存在 的 类 的 接口 不 符合 我 们 的 需求 。 

(2) 创建 一 个 可 以 复 用 的 类 ， 使 得 该 类 可 以 与 其 他 不 相关 的 类 或 
不 可 预见 的 类 〈 即 那些 接口 可 能 不 一 定 兼容 的 类 ) 协同 工作 。 

(3) 在 不 对 每 一 个 都 进行 子 类 化 以 匹配 它们 的 接口 的 情况 下 ， 使 
用 一 些 已 经 存在 的 子 类 。 


4.2.5 访问 方式 隔离 


东汉 末年 ， 大 将 军 何 进 引 董卓 入 京 ， 想 借 西北 王 的 军队 对 抗 闪 
党 ， 无 奈 自 己 先 被 阅 党 做 掉 ， 而 后 造成 巨变 ， 导 致 诸侯 并 起 ， 最 终 形 
成 三 国 见 立 局 面 。 汉 献帝 即位 后 ， 初 平 三 年 〈 公 元 192 年 ) ， 治 中 从 事 
毛 玲 向 曹操 建议 “奉天 子 以 令 不 臣 >， 曹 操 采纳 了 他 的 建议 ， 迎 接 汉 献 
帝 来 到 许昌 。 汉 献帝 刘 协 在 许 都 没有 实际 的 权利 ， 曹 操 不 断 地 诛 除 公 
卿 大 臣 ， 不 断 地 集 军 政大 权 于 一 身 。 建 安 元 年 八 月 ， 曹 操 进驻 洛阳 ， 
立刻 起 张 杨 、 杨 奉 兵 众 在 外 ， 赶 跑 了 韩 运 ， 接 着 做 了 三 件 事 : 杀 侍 中 
AR 尚书 冯 硕 等 ， 请 it SE”; 3 封 董 承 、 伏 完 等 ， 请 SZ; iB 
射 声 校 尉 泪 俊 ， 谓 “和 萎 死 节 ”。 然 后 在 第 九天 趁 他 人 尚未 来 生 时 及 反应 的 
都 许 ， 使 皇帝 摆脱 其 他 势力 的 控制 。 此 后 ， 他 还 加 紧 步 
伐 剪 除 异 己 ， 提 高 自己 的 权势 。 他 首先 向 最 有 影响 力 的 三 公 发 难 ， 罢 
2 ur dE xt HRARVOME: EXREBRGUOS, 
Be ERXLERIU mmie—HmbAxBumd,duk^AA, 
一 方面 将 大 将 军 让 予 袁 绍 ， 稳 定 大 敌 。 这 就 是 历史 上 著名 的 “ 挟 天 子 以 
令 诸 侯 ”。 汉 献帝 与 曹操 的 关系 ， 是 历史 上 两 位 伟大 的 政治 家 的 联手 ， 
稳定 了 东汉 政权 ， 最 终 平稳 交接 给 曹魏 政权 ， 也 间接 映射 了 我 们 本 节 
要 讲解 的 “代理 模式 ”。 

代理 模式 使 用 代理 对 象 完 成 用 户 请 求 ， 屏 珊 用 户 对 真实 对 象 的 访 
问 。 现 实 世 界 的 代理 人 被 授权 执行 当事人 的 一 些 事宜 ， 无 须 当 事 人 出 
面 ， 从 第 三 方 的 角度 看 ， 似 乎 当事人 并 不 存在 ， 因 为 他 只 和 代理 人 通 
信 。 而 事实 上 代理 人 是 要 有 当事人 的 授权 ， 并 且 在 核心 问题 上 还 需要 
请 示 当 事 人 。 

在 软件 设计 中 ， 使 用 代理 模式 的 意图 也 很 多 ， 比 如 因为 安全 原因 
需要 屏蔽 客户 端 直 接 访 问 真实 对 象 ， 或 者 在 远程 调用 中 需要 使 用 代理 
类 处 理 远程 方法 调用 的 技术 细节 (如 RMI) ， 也 可 能 为 了 提升 系统 性 
能 ， 对 真实 对 象 进行 封装 ， 从 而 达到 延迟 加 载 的 目的 。 

代理 模式 角色 分 为 4 种 : 

(1) 主题 接口 : 定义 代理 类 和 真实 主题 的 公共 对 外 方法 ， 也 是 代 
理 类 代理 真实 主题 的 方法 。 

(2) 真实 主题 : 真正 实现 业务 逻辑 的 类 


(3) 代理 类 : 用 来 代理 和 封装 真实 主题 。 
(4) Main: 客户 端 ， 使 用 代理 类 和 主题 接口 完成 一 些 工 作 。 

延迟 加 载 

以 一 个 简单 的 示例 来 前 述 使 用 代理 模式 实现 延迟 加 载 的 方法 及 其 
意义 。 假 设 某 客户 端 软 件 有 根据 用 户 请 求 去 数据 库 查 询 数 据 的 功能 。 
在 查询 数据 前 ， 需 要 获得 数据 库 连 接 ， 软 件 开启 时 初始 化 系统 的 所 有 
的 泪 ， 此 时 尝试 获得 数据 库 连 接 。 当 系统 有 大 量 的 类 似 操作 存在 时 

(比如 XML 解析 等 ) ， 所 有 这 些 初 始 化 操作 的 荆 加 会 使 得 系统 的 启动 

速度 变 得 非常 缓慢 。 为 此 ， 使 用 代理 模式 的 代理 类 封装 对 数据 库 查询 
中 的 初始 化 操作 ， 当 系统 启动 时 ， 初 始 化 这 个 代理 类 ， 而 非 真实 的 数 
据 库 查询 类 ， 而 代理 类 什么 都 没有 做 。 因 此 ， 它 的 构造 是 相当 迅速 
的 。 

在 系统 启动 时 ， 将 消耗 资源 最 多 的 方法 都 使 用 代理 模式 分 离 ， 可 
以 加 快 系统 的 启动 速度 ， 减 少 用 户 的 等 待 时 间 。 而 在 用 户 真正 做 查询 
操作 时 再 由 代理 类 单独 去 加 载 真 实 的 数据 库 查询 类 ， 完 成 用 户 的 请 
求 。 这 个 过 程 就 是 使 用 代理 模式 实现 了 延迟 加 载 。 

延迟 加 载 的 核心 思想 是 : 如 果 当 前 并 没有 使 用 这 个 组 件 ， 则 不 需 
要 真正 地 初始 化 它 ， 使 用 一 个 代理 对 象 蔡 代 它 的 原 有 的 位 置 ， 只 要 在 
真正 需要 的 时 候 才 对 它 进 行 加 载 。 使 用 代理 模式 的 延迟 加 载 是 非常 有 
意义 的 ， 首 先 ， 它 可 以 在 时 间 轴 上 分 散 系统 压力 ， 尤 其 在 系统 启动 
时 ， 不 必 完 成 所 有 的 初始 化 工作 ， 从 而 加 速 启 动 时 间 ; 其 次 ， 对 很 多 
真实 主题 而 言 ， 在 软件 启动 直到 被 天 闭 的 整个 过 程 中 ， 可 能 根本 不 会 
被 调用 ， 初 始 化 这 些 数 据 无 疑 是 一 种 资源 浪费 。 例 如 使 用 代理 类 封装 
数据 库 查 询 类 后 ， 系 统 的 启动 过 程 这 个 例子 。 若 系统 不 使 用 代理 模 
式 ， 则 在 启动 时 就 要 初始 化 DBQuery 对 象 ， 而 是 用 代理 模式 后 ， 启 动 
时 只 需要 初始 化 一 个 轻 量 级 的 对 象 DBQueryProxy。 

如 代码 清单 4-39 所 示 ，IDBQuery 是 主题 接口 ， 定 义 代理 类 和 真实 
类 需要 对 外 提供 的 服务 ， 定 义 了 视线 数据 库 查询 的 公共 方法 request 
() 图 数 。DBQuery 是 真实 主题 ， 负 责 实 际 的 业务 操作 ， 
DBQueryProxy 是 DBQuery 的 代理 类 。 


代码 清单 -39 ”延迟 加 载 代理 
public interface IDBQuery { 
String request () ; 


public class DBQuery implements IDBQuery{ 
public DBQuery() { 
try{ 


Thread.sleep(1000) ; // 假 设 数据 库 连 接 等 耗 时 操作 
)catch(InterruptedException ex) { 


ex.printStackTrace(); 


@Override 
public String request() { 
// TODO Auto-generated method stub 


return "request string"; 


public class DBQueryProxy implements IDBQuery{ 


private DBQuery real = null; 


@Override 
public String request() { 
// TODO Auto-generated method stub 
// 在 真正 需要 的 时 候 才 能 创建 真实 对 象 ， 创 建 过 程 可 能 很 慢 
if (real--null)( 
real = new DBQuery(); 
}/ /在 多 线程 环境 下 ， 这 里 返回 一 个 虚假 类 ， 类 似 于 Future RA 


return real.request(); 


u 


public class Main { 
public static void main(String[] args)( 


IDBQuery q = new DBQueryProxy(); // 使 用 代理 
// 在 真正 使 用 时 才 创 建 真实 对 象 


q.request () 


动态 代理 

动态 代理 是 指 在 运行 时 动态 生成 代理 类 。 即 代理 类 的 字 节 码 将 在 
运行 时 生成 并 载 入 当前 运行 的 ClassLoader。 与 静态 处 理 类 相 上 比 ， 动态 
类 有 诸多 好 处 。 首 先 ， 不 需要 为 真实 主题 写 一 个 形式 上 完全 一 样 的 封 
装 类 ， 假 如 主题 接口 中 的 方法 很 多 ， 为 每 一 个 接口 写 一 个 代理 方法 也 
TT 如 果 接 口 有 变动 ， 则 真实 主题 和 代理 类 都 要 修改 ， 不 利于 系 

统 维护 ; 其 次 ， 使 用 一 些 动态 代理 的 生成 方法 甚至 可 以 在 运行 时 制定 

代理 类 的 执行 逻辑 ， 从 而 大 大 提升 系统 的 灵活 性 。 

动态 代理 类 使 用 字 节 码 动 态 生 成 加 载 技 术 ， 在 运行 时 生成 加 载 
类 。 生 成 动态 代理 类 的 方法 很 多 ， 如 ，JDK 自 带 的 动态 处 理 、CGLIB、 
Javassist 或 者 ASM 库 。JDK 的 动态 代理 使 用 简单 ， 它 内 置 在 JDK 中 ， 因 
此 不 需要 引入 第 三 方 Jar 包 ,但 相对 功能 比较 弱 。CGLIB 和 Javassist 都 是 
高 级 的 字 节 码 生 成 库 ， 总 体 性 能 比 JDK 自 带 的 动态 代理 好 ， 而 且 功 能 十 
分 强大 。ASM 是 低级 的 字 节 码 生 成 工具 ， 使 用 ASM 已 经 近乎 于 在 使 用 
Java bytecode 编 程 ， 对 开发 人 员 要 求 最 高 ， 当 然 ， 也 是 性 能 最 好 的 一 种 
动态 代理 生成 工具 。 但 ASM 的 使 用 很 烦琐 ， 而 且 性 能 也 没有 数量 级 的 
提升 ， 与 CGLIB 等 高 级 字 节 码 生成 工具 相 比 ，ASM 程 序 的 维护 性 较 
差 ， 如 果 不 是 在 对 性 能 有 苛刻 要 求 的 场合 ， 还 是 推荐 CGLIB 或 者 
Javassisto 

以 代码 清单 4-39 所 示人 代码 中 的 DBQueryProxy 为 例 ， 使 用 动态 代理 
生成 动态 类 ， 蔡 换 上 例 中 的 DBQueryProxy。 首先， 使 用 JDK 的 动态 代 
里 生成 代理 对 象 。JDK 的 动态 代理 需要 实现 一 个 处 理 方法 调用 的 
Handler， 用 于 实现 代理 方法 的 内 部 人 逻辑。 


代码 清单 4-40 动态 代理 
import java.lang.reflect.InvocationHandler; 


import java.lang.reflect.Method; 


public class DBQueryHandler implements InvocationHandler{ 


IDBQuery realQuery = null;// 定 义 主题 接口 


@Override 
public Object invoke (Object proxy, Method method, Object[] args) 
throws Throwable { 
// TODO Auto-generated method stub 
// 如 果 第 一 次 调用 ， 生 成 真实 主题 
if(realQuery == null) { 
realQuery = new DBQuery(); 
} 
// 返 回 真实 主题 完成 实际 的 操作 


return realQuery.request (); 


} 


以 上 代码 实现 了 一 个 Handler， 可 以 看 到 ， 它 的 内 部 逻辑 和 
DBQueryProxy 是 类 似 的 。 在 调用 真实 主题 的 方法 前 ， 先 尝试 生成 真实 
主 提 对 象 。 接 着 ， 需 要 使 用 这 个 Handler 生 成 动态 代理 对 象 。 如 代码 清 
单 4-41 所 示 。 


代码 清单 4-41 生成 动态 代理 对 象 
import java.lang.reflect.InvocationHandler; 
import java.lang.reflect.Method; 


import java.lang.reflect.Proxy; 


public class DBQueryHandler implements InvocationHandler{ 


IDBQuery realQuery = nul1;// 定 义 主题 接口 


QOverride 


public Object invoke(Object proxy, Method method, Object[] args) 


throws Throwable { 
// TODO Auto-generated method stub 
// 如 果 第 一 次 调用 ， 生 成 真实 主题 
if(realQuery == null) { 

realQuery = new DBQuery(); 
} 
// 返 回 真实 主题 完成 实际 的 操作 


return realQuery.request (); 


public static IDBQuery createProxy() { 
IDBQuery proxy = (IDBQuery)Proxy.newProxyInstance( 
ClassLoader.getSystemClassLoader(), new Class[]{IDBQuery.class}, 
new DBQueryHandler () 
di 


return proxy; 


以 上 代码 生成 了 一 个 实现 了 IDBQuery 接 口 的 代理 类 ， 代 理 类 的 内 
部 逻辑 由 DBQueryHandler 决 定 。 生 成 代理 类 后 ， 由 newProxyInstance 
() 方法 返回 该 代理 类 的 一 个 实例 。 至 此 ， 一 个 完整 的 动态 代理 完成 
EC 
在 Java 中 ， 动 态 代 理 类 的 生成 主要 涉及 对 ClassLoader 的 使 用 。 以 
CGLIB 为 例 ， 使 用 CGLIB 生 成 动态 代理 ， 首 先 需要 生成 Enhancer 类 实 
例 ， 并 指定 用 于 处 理 代 理 业 务 的 回调 类 。 在 Enhancercreate () 方法 
中 ， 会 使 用 DefaultGeneratorStrategy.Generate () 方法 生成 动态 代理 类 
的 字 节 码 ， 并 保存 在 byte 数 组 中 。 接 着 使 用 ReflectUtils.defineClass () 
方法 ， 通 过 反射 ， 调 用 ClassLoader.defineClass () 方法 ， 将 字 节 码 装 载 
到 ClassLoader 中 ， 完 成 类 的 加 载 。 最 后 使 用 ReflectUtils.newInstance 
0 方法 ， 通 过 反射 ， 生 成 动态 类 的 实例 ， 并 返回 该 实例 。 基 本 流程 
是 根据 指定 的 回调 类 生成 Class 字 节 码 — 通过 defineClass () 将 字 节 码 定 
义 为 类 一 使 用 反射 机 制 生成 该 类 的 实例 。 从 代码 清单 4-42 到 代码 清单 4- 
45 所 示 是 使 用 CGLIB 动 态 反 射 生成 类 的 完整 过 程 。 


代码 清单 4-42 定义 接口 
public interface BookProxy { 
public void addBook(); 
} 


代码 清单 4-43 “定义 实现 类 
// 该 类 并 没有 申明 BookProxy #2 
public class BookProxyImpl { 
public void addBook() | 
System.out ,println(" 增 加 图 书 的 普通 方法 ,,,") 
} 


代码 清单 4-44 ”定义 反射 类 及 重 载 方法 


import java.lang.reflect.Method; 


import net.sf.cglib.proxy.Enhancer; 
import net.sf.cglib.proxy.MethodInterceptor; 
import net.sf.cglib.proxy.MethodProxy; 


public class BookProxyLib implements MethodInterceptor { 


private Object target; 


/[** 
* 创建 代理 对 象 
* 
* (param target 
* (return 
v 


public Object getInstance(Object target) { 
this.target = target; 
Enhancer enhancer = new Enhancer (); 
enhancer.setSuperclass(this.target.getClass()); 
// 回调 方法 
enhancer.setCallback(this); 
// 创建 代理 对 象 


return enhancer.create(); 


@Override 
// 回调 方法 
public Object intercept(Object obj, Method method, Object[] args, 
MethodProxy proxy) throws Throwable { 
System.out .println(" 事 物 开 始 ") ; 
proxy.invokeSuper(obj, args); 
System.out.println("3 4525 &"); 


return null; 


代码 清单 4-45 ”运行 程序 
public class TestCglib { 
public static void main(String[] args) ( 
BookProxyLib cglib-new BookProxyLib(); 
BookProxyImpl bookCglib- (BookProxyImpl)cglib.getInstance (new BookProxyImpl()); 
bookCglib.addBook(); 


代码 清单 4-46 ”运行 输出 
事物 开始 


增加 图 书 的 普通 方法 ，,， 
事物 结束 


代理 模式 有 多 种 应 用 场合 ， 如 下 所 述 : 

m 远程 代理 ， 也 就 是 为 一 个 对 象 在 不 同 的 地 址 空间 提供 局 部 代表 ， 
这 样 可 以 隐藏 一 个 对 象 存 在 于 不 同 地 址 空间 的 事实 。 比 如 说 
WebService， 当 我 们 在 应 用 程序 的 项 目 中 加 入 一 个 web 引 用 ，5 引 用 一 个 
WebService， 此 时 会 在 项 目 中 声称 一 个 WebReference 的 文件 夹 和 一 些 
文件 ， 这 个 就 是 起 代理 作用 的 ， 这 样 可 以 让 那个 客户 端 程序 调用 代理 
解决 远程 访问 的 问题 。 

m 虚拟 代理 ， 是 根据 需要 创建 开销 很 大 的 对 象 ， 通 过 它 来 存放 实例 
化 需要 很 长 时 间 的 真实 对 象 。 这 样 就 可 以 达到 性 能 的 最 优化 ， 比 如 打 
开 一 个 网 页 ， 这 个 网 页 里 面包 含 了 大 量 的 文字 和 图 片 ， 但 我 们 可 以 很 
快 看 到 文字 ， 但 是 图 片 却 是 一 张 一 张 地 下 载 后 才能 看 到 ， 那 些 未 打开 
的 图 片 框 ， 就 是 通过 虚拟 代 里 来 替换 了 真实 的 图 片 ， 此 时 代理 存储 了 
真实 图 片 的 路 径 和 尺寸 。 

m 安全 代理 ， 用 来 控制 真实 对 象 访问 时 的 权限 。 一 般 用 于 对 象 应 该 
有 不 同 的 访问 权限 的 时 候 。 

加 指针 引用 ， 是 指 当 调用 真实 的 对 象 时 ， 代 理 处 理 另外 一 些 事 。 比 
如 计算 真实 对 象 的 引用 次 数 ， 这 样 当 该 对 象 没 有 引用 时 ， 可 以 自动 释 
放 它 ， 或 当 第 一 次 引用 一 个 持久 对 象 时 ， 将 它 装 入 内 存 ， 或 是 在 访问 
一 个 实际 对 象 前 ， 检 查 是 否 已 经 释放 它 ， 以 确保 其 他 对 象 不 能 改变 
它 。 这 些 都 是 通过 代理 在 访问 一 个 对 象 时 附加 一 些 内 务 处 理 。 

m 延迟 加 载 ， 用 代理 模式 实现 延迟 加 载 的 一 个 经 典 应 用 就 在 
Hibernate 框 架 里 面 。 当 Hibernate 加 载 实 体 bean 时 ， 并 不 会 一 次 性 将 数 
据 库 所 有 的 数据 都 装载 。 默 认 情 况 下 ， 它 会 采取 延迟 加 载 的 机 制 ， 以 
提高 系统 的 性 能 。Hibernate 中 的 延迟 加 载 主要 分 为 属性 的 延迟 加 载 和 
关联 表 的 延 时 加 载 两 类 。 实 现 原理 是 使 用 代理 拦截 原 有 的 getter 方 法 ， 
在 真正 使 用 对 象 数 据 时 才 去 数据 库 或 者 其 他 第 三 方 组 件 加载 实 际 的 数 
据 ， 从 而 提升 系统 性 能 。 


4.3 IO 及 网 络 相关 优化 


4.3.1 IO 操作 优化 


在 实际 的 生产 环境 中 ，LIO 操 作 往 往 会 成 为 性 能 瓶颈 ， 这 是 不 可 否 
认 的 事实 ， 也 是 众多 开发 人 员 首 要 考虑 的 优化 问题 。 如 果 在 Windows 环 
境 下 我 们 使 用 阻塞 1/O 模 型 来 编写 分 布 式 应 用 ， 其 维护 成 本 会 很 高 。 
为 客户 端的 链接 数量 直接 决定 了 服务 器 内 存 开 辟 的 线程 数量 乘 以 2 ( 包 
含 一 个 输入 线程 和 一 个 输出 线程 ) ， 并 且 这 些 线程 是 无 法 采用 线程 池 
优化 的 ， 因 为 线程 的 执行 时 间 大 于 其 创建 和 销毁 时 间 。 长 时 间 的 大 量 
并 发 线程 挂 起 ， 不 仅 CPU 要 做 实时 任务 切换 ， 其 整体 物理 资源 都 将 一 
步 步 被 码 食 ， 直 至 最 后 程序 骨 溃 。 在 早期 的 网 络 变 成 中 ， 采 用 阻塞 IO 
模型 来 编写 分 布 式 应 用 ， 唯 一 能 做 的 性 能 优化 只 有 采取 系统 的 硬件 堆 
机 器 方式 。 在 付出 高 昂 的 硬件 成 本 开销 后 ， 项 目的 可 维护 性 也 很 低 。 
而 且 大 多 数 实 际 项 目 都 是 基于 Linux 的 ， 跟 Windows 内 核 结构 不 同 的 
是 ，Linux 环 境 下 是 没有 真正 意义 上 的 线程 概念 的 。 其 所 谓 的 线程 都 采 
用 进行 模拟 的 方式 ， 也 就 是 伪 线 程 ， 因 此 ， 对 于 兵法 要 求 极 高 的 场景 
F, 一旦 采用 阻塞 VO 模型 无 疑 是 非常 不 可 取 的 。 对 有 可 能 存在 大 量 网 
络 1/O 的 应 用 程序 来 说 ， 降 低 系统 态 CPU 使 用 的 一 个 策略 是 使 用 Java 
NIO 的 非 阻塞 数据 结构 。 

Java IO 模型 由 同步 JO 和 异步 IO 构 成 。 同 步 O 模 型 包含 阻塞 WO 和 
非 阻塞 IO， 而 在 windows 环 境 下 只 要 调用 IOCP 的 IO 模型 ， 就 是 真正 意 
义 上 的 异步 JO。IOCP (Input/Output Completion Port， 输 入 二 输出 完成 
mO) 简单 来 说 是 一 种 系统 级 别 的 高 性 能 异步 WO 模型 。 应 用 程序 中 所 
有 的 IO 操作 将 全 部 委托 给 操作 系统 去 执行 ， 直 至 最 后 通知 并 返回 结 
果 。Java7 对 IOCP 进 行 了 深度 封装 ， 这 使 得 开发 人 员 可 以 使 用 IOCP API 
编写 高 效 的 分 布 式 上 应用。 注意， 由 于 IOCP 仅 限于 使 用 在 Widnows 平 台 
上 ， 因 而 自然 无 法 再 Linux 平 台 上 使 用 它 ，Linux 平 台 可 以 使 用 Epoll。 
Epoll 并 不 是 真正 意义 上 的 异步 IO ， 按 照 Unix 网 络 编程 的 划分 ， 多 路 复 
用 IO 仍然 属于 同步 IJO 模 型， 也 就 是 说 Epoll 其 实 就 是 多 路 复 用 LO。 

同步 IO 方式 导致 所 有 的 客户 端 连接 在 请 求 服务 端 时 都 会 阻塞 住 ， 
等 待 前 面 的 完成 。 即 使 是 使 用 短 和 连接， 数据 在 写 入 OutputStream 或 者 从 
InputStream 读 取 时 都 有 可 能 会 阻塞 。 这 在 大 规模 的 访问 量 或 者 系统 对 
性 能 有 要 求 的 时 候 是 不 能 接受 的 。 具 体 示 例如 代码 清单 4-47 所 示 。 


代码 清单 4-47 1/0 阻塞 式 示例 


import java.io.BufferedReader; 


import java.io.IOException; 
import java.io.InputStreamReader; 


import java.net.ServerSocket; 


import java.net.Socket; 


import java.net.SocketException; 


public class BlockingIODemo { 


public void blockingloSocket() throws Exception 
{ 
ServerSocket serverSocket = new ServerSocket (10002); 
Socket socket = null; 
try 
{ 
while (true) 
{ 
socket = serverSocket.accept(); 
System. out.print1n ("socket if 接 : " * 
Socket.getRemoteSocketAddress().toString()); 
BufferedReader in - new BufferedReader (new 
InputStreamReader (socket.getInputStream())); 
while (true) 
{ 
String readLine = in.readLine(); 
System.out.println (" 收 到 消息 " + readLine) ; 
if ("end".equals (readLine)) 
{ 
break; 
} 
// 客 户 端 断 开 连 接 
socket.sendUrgentData (OxFF) ; 


catch (SocketException se) 


System.out .println ("SP 38 7 ER") ; 


catch (IOException e) 


e.printStackTrace(); 


finally 


System.out.println("socket 关 闭 : " + 
Socket .getRemoteSocketAddress () .toString()); 


Socket.close(); 


} 


解决 这 个 问题 的 方法 是 使 用 多 线程 技术 ， 一 个 客户 端 一 个 处 理 线 
程 ， 出 现 阻 塞 时 只 是 一 个 线程 阻塞 而 不 会 影响 其 他 线程 工作 ; 为 了 减 
少 系 统 线程 的 开销 ， 采 用 线程 池 的 办 法 来 减少 线程 创建 和 回收 的 成 
本 。 

简单 的 实现 例子 如 下 ， 使 用 一 个 线程 (Acoto) 接收 客户 端 请 
求 ， 为 每 个 客户 端 新 建 线 程 进行 处 理 (Processor) ， 示 例 代 码 如 代码 
清单 4-48 所 示 。 


代码 清单 4-48 多 线程 VO 阻塞 式 示例 
import java.io.BufferedReader; 
import java.io.IO0Exception; 
import java.io.InputStreamReader; 
import java.net.ServerSocket; 
import java.net.Socket; 


import java.net.SocketException; 


import java.util.Scanner; 


public class MultiThreadBlocking10Demo 


{ 
public void testMultithreadJIoSocket() throws Exception 


{ 
ServerSocket serverSocket = new ServerSocket (10002); 
Thread thread = new Thread(new Accptor (serverSocket) ); 
thread. start (); 


Scanner scanner = new Scanner (System. in) ; 


scanner. next (); 


public class Accptor implements Runnable 


| 


private ServerSocket serverSocket; 


public Accptor(ServerSocket serverSocket) 
{ 


this.serverSocket = serverSocket; 


public void run() 
{ 
while (true) 
{ 
Socket socket = null; 
try 
{ 
socket = serverSocket.accept (); 
if(socket != null) 


{ 


System.out .Println(" 收 到 了 socket: " + socket.getRemoteSocketAddress ().toString()); 


Thread thread = new Thread(new Processor (socket) ); 


thread.start(); 


} 
catch (IOException e) 
{ 


e.printStackTrace(); 


public class Processor implements Runnable 
{ 
private Socket socket; 


public Processor (Socket socket) 
{ 


this.socket = socket; 


@Override 
public void run() 
{ 
try 
{ 
BufferedReader in = new 
InputStreamReader (socket.getInputStream())); 
String readLine; 


while (true) 


BufferedReader (new 


readLine = in.readLine(); 
System.out .pintln(" 收 到 消息 " + readLine); 
if("end".equals (readLine)) 
{ 
break; 
} 
/ /客户 端 断 开 连 接 
Socket.sendUrgentData (OxFF); 
Thread.sleep (5000); 


) 
catch (InterruptedException e) 
{ 
e.printStackTrace(); 

) 
catch (SocketException se) 
{ 

System.out .println(" 客 户 端 断 开 连接 ") ; 
} 
catch (IOException e) 
{ 

e.printStackTrace(); 
) 
finally ( 

try 

{ 

socket.close(); 

} 

catch (IOException e) 

{ 


e.printStackTrace(); 


这 种 阻塞 IO 的 解决 方案 在 大 部 分 情况 下 是 适用 的 ， 在 出 现 NIO 之 
前 是 最 通常 的 解决 方案 ，Tomcat 里 阻塞 IO 的 实现 就 是 这 种 方式 。 但 是 
如 果 是 大 量 的 长 连接 请 求 呢 ? 不 可 能 创建 几 百 万 个 线程 保持 连接 。 再 
退 一 步 ， 就 算 线 程 数 不 是 问题 ， 如 果 这 些 线程 都 需要 访问 服务 端的 某 
些 竞争 资源 ， 势 必需 要 进行 同步 操作 ， 这 本 身 就 是 得 不 偿 失 的 。 

NIO 并 不 等 同 于 非 阻塞 WHO， 只 要 设置 Blocking 属 性 就 可 以 控制 阻塞 
非 阻塞 。 非 阻塞 TO 图。 


代码 清单 4-49 JEE 1O 方式 示例 


import 
import 
import 
import 
import 
import 
import 
import 


import 


public 
{ 


java. 
java 
java 
java 
java 
java 
java 
java 


java 


io. IOException; 


-net.InetSocketAddress; 
.net.SocketAddress; 
.nio.ByteBuffer; 
.nio.channels.SelectionKey; 
.nio.channels.Selector; 
.nio.channels.ServerSocketChannel; 
.nio.channels.SocketChannel; 


.util.Iterator; 


class NoneBlockingIODemo 


Selector selector; 


private ByteBuffer receivebuffer - ByteBuffer.allocate (1024); 


public void testNioNonBlockingSelector () 


private void handleKey(SelectionKey selectionKey) 


{ 


throws Exception 


selector - Selector.open(); 
SocketAddress address - new InetSocketAddress (10002); 
ServerSocketChannel channel = ServerSocketChannel.open(); 


channel.socket().bind(address); 


channel.configureBlocking(false); 


channel.register (selector, SelectionKey.OP ACCEPT); 


while 


( 


(true) 


selector.select(); 


Iterator«SelectionKey» iterator = selector.selectedKeys() 


while (iterator.hasNext()) { 


SelectionKey selectionKey = iterator.next(); 
iterator.remove(); 


handleKey (selectionKey); 


ServerSocketChannel server - null; 


SocketChannel client - null; 


if (selectionKey.isAcceptable() ) 


{ 


server = (ServerSocketChannel) selectionKey.channel () ; 


client = server.accept (); 
System.out.println(" 客 fF 端 
client.socket().getRemoteSocketAddress().toString()); 


.iterator(); 


throws IOException 


client.configureBlocking (false); 
client.register(selector, SelectionKey.OP READ); 
} 
if (selectionKey.isReadable () ) 
{ 
client = (SocketChannel) selectionKey.channel () ; 
receivebuffer.clear(); 
int count = client.read(receivebuffer) ; 
if (count > 0) { 
String receiveText = new String( receivebuffer.array(),0,count) ; 
System,out ,println(" 服 务 器 端 接 受 客户 端 数 据 --:" + receiveText) ; 
client.register(selector, SelectionKey.OP READ); 


} 


Java NIO 提 供 的 非 阻塞 VO 并 不 是 单纯 的 非 阻 塞 O 模 式 ， 而 是 建立 
在 Reactor 模 式 上 的 IO 复 用 模型 ; 在 IO multiplexing Model P, HFE 
一 个 socket， 一 般 都 设置 成 为 non-blocking， 但 是 整个 用 户 进 程 其 实 是 
一 直 被 阻塞 的 。 只 不 过 进程 是 被 select 这 个 国 数 阻塞 ， 而 不 是 被 socket 
IO 给 阻塞 ， 所 以 还 是 属于 非 阻塞 的 IO。 

总 的 来 说 ， 非 阻塞 /JO 和 阻塞 VO 最 大 的 不 同 在 于 ， 非 阻塞 VO 并 不 
会 在 MO 请 求 时 产生 阻塞 ， 也 就 是 说 如 果 服 务 端 没有 收 到 IO 请 求 时 ， 非 
阻塞 IO 会 持续 轮 询 方式 对 MO 请 求 ， 当 有 请 求 进来 后 开发 执行 JO 操 作 
并 阻塞 请 求 进程 。Java7 人 允许 开发 人 员 使 用 IOCP API 进 行 异 步 /O 编 程 ， 
这 使 得 开发 人 员 不 必 再 关心 IO 是 否 阻塞 ， 因 为 程序 中 所 有 的 IO 操作 将 
全 部 委托 给 操作 系统 线程 去 执行 ， 直 至 最 后 通知 并 返回 结果 。 


4.3.2 Socket 编 程 


Socket 编 程 离 不 开 TCP/IP、UDP 等 协议 ， 我 们 逐一 介绍 这 两 个 协 
议 。 

TCP/IP (Transmission Control Protocol/Internet Protocol) ， 即 传输 
控制 协议 /网 间 协 议 。TCP/IP 是 一 个 工业 标准 的 协议 集 ， 它 是 为 广域网 

(WANs) 设计 的 。 举 一 个 例子 ， 如 果 你 要 打 电 话 给 一 个 朋友 ， 通 常 的 

做 法 是 先 拨 号 ， 朋 友 听 到 电话 铃声 后 提起 电话 ， 这 时 你 和 你 的 朋友 就 
建立 起 了 连接 ， 就 可 以 讲话 了 。 等 交流 结束 ， 挂 断 电 话 结束 此 次 交 
谈 。 整 个 流程 图 如 图 4-7 所 示 。 

UDP (User Data Protocol) ， 即 用 户 数 据 报 协议 。UDP 是 与 TCP 相 
对 应 的 协议 ， 它 属于 TCP/IP 协 议 族 中 的 一 种 。UDP 流 程 图 如 图 4-8 所 
To 

Socket 是 应 用 层 与 TCP/PP 协 议 族 通信 的 中 间 软 件 抽象 层 ， 它 是 一 组 
接口 。 在 设计 模式 中 ，Socket 其 实 就 是 一 个 门面 模式 ， 它 把 复杂 的 
TCP/IP 协 议 族 隐藏 在 Socket 接 口 后 面 ， 对 用 户 来 说 ， 一 组 简单 的 接口 就 
是 全 部 ， 让 Socket 去 组 织 数 据 ， 把 具体 符合 指定 协议 的 处 理 方法 隐藏 在 
Socket 后 面 。 


TCP 服 务 器 端 


TCP Pim 


图 4-7 TCP/IP 流 程 图 


应 用 层 


图 4-8 UDP 流程 图 


假如 我 们 想 使 用 Socket， 服 务 器 端 需要 先 初 始 化 Socket， 然 后 与 端 
口 绑 定 (bind) ， 对 端口 进行 监听 (listen) ， 接 下 来 调用 accept 阻 塞 ， 
等 待 客户 端 连 接 。 这 时 如 果 有 个 客户 端 初 始 化 一 个 Socket， 然 后 连接 服 
务 器 (connect) ， 如 果 连 接 成 功 ， 这 时 客户 端 与 服务 器 端的 连接 就 建 
立 了 。 客 户 疹 发 送 数据 请 求 ， 服 务 器 端 接收 请 求 并 处 理 请 求 ， 然 后 把 
回应 数据 发 送 给 客户 端 ， 客 户 端 读 取 数 据 ， 最 后 关闭 连接 ， 这 样 一 次 
交互 就 结束 了 。 

Java 提 供 的 Socket 包 有 很 多 参数 ， 每 个 参数 都 有 自己 的 意义 。 

backlog: 用 于 ServerSocket， 配 置 ServerSocket 的 最 大 客户 端 等 待 队 
列 。 先 看 代码 清单 4-50 所 示 的 Socket 示 例 代 码 。 


代码 清单 4-50 Socket 示例 代码 
public class Main ( 
public static void main(String[] args) throws Exception { 
int port - 8999; 
int backlog = 2; 
ServerSocket serverSocket = new ServerSocket(port, backlog); 
Socket clientSock = serverSocket.accept () ; 
System.out.println("revcive from " + clientSock.getPort ()) ; 
while (true) { 
byte buf[] = new byte[1024]; 
int len = clientSock.getInputStream().read(buf); 
System.out.println(new String(buf, 0, len)); 
} 
} 
} 


这 段 测试 代码 在 第 一 次 处 理 一 个 客户 端 时 ， 就 不 会 处 理 第 二 个 客 
户 端 ， 所 以 除了 第 一 个 客户 端 ， 其 他 客户 端 就 是 等 待 队 列 了 。 所 以 这 
个 服务 器 最 多 可 以 同时 连接 3 个 客户 端 ， 其 中 2 个 等 待 队 列 。 大 家 可 以 
telnet localhost 8999 测 试 下 。 这 个 参数 设置 为 -1 表示 无 限制 ， 默 认 是 50 
个 最 大 等 待 队列 ， 如 果 设 置 无 限制 ， 那 么 你 要 小 心 了 ， 如 果 你 服务 器 
无 法 处 理 那 么 多 连接 ， 那 么 当 很 多 客户 端 连 到 你 的 服务 器 时 ， 每 一 个 
TCP 连 接 都 会 占用 服务 器 的 内 存 ， 最 后 会 让 服务 器 骨 冲 的 。 

另外 ， 就 算 你 设置 了 backlog 为 10， 如 果 你 的 代码 中 是 一 直 Socket 
clientSock=serverSocket.accept () ， 假 设 我 们 的 机 器 最 多 可 以 同时 处 理 
100 个 请 求 ， 总 共有 100 个 线程 在 运行 ， 然 后 你 把 在 100 个 线程 的 线程 闻 
处 理 clientSock， 不 能 处 理 的 clientSock 就 排队 ， 最 后 clientSock 越 来 越 
多 ， 也 意味 着 TCP 连 接 越 来 越 多 ， 也 意味 着 我 们 的 服务 器 的 内 存 使 用 越 
来 越 高 (客户 端 连接 进程 ， 肯 定 会 发 送 数 据 过 来 ， 数 据 会 保存 到 服务 
器 端的 TCP 接 收 缓存 区 ) ， 最 后 服务 器 就 宕 机 了 。 所 以 如 果 你 不 能 处 理 
那么 多 请 求 ， 请 不 要 循环 无 限制 地 调用 serverSocket.accept () , AN 
backlog 也 无 法 生效 。 如 果真 的 请 求 过 多 ， 只 会 让 你 的 服务 器 宕 机 CB 
信 很 多 人 都 这 么 写 ， 要 注意 点 ) o 


TcpNoDelay: 禁用 纳 格 算法 ， 将 数据 立即 发 送出 去 。 纳 格 算法 是 
以 减少 封包 传送 量 来 增进 TCP/IP 网 络 的 效能 ， 当 我 们 调用 下 面 代 码 ， 
如 代码 清单 4-51 所 示 。 


代码 清单 4-51 纳 格 算法 示例 


Socket socket = new Socket(); 


socket.connect (new InetSocketAddress (host, 8000)); 


InputStream in = socket.getInputStream(); 


0 


S 
5 
0 
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utputStream out = socket.getOutputStream(); 


tring head - "hello "; 
tring body = "world\r\n"; 


ut .write (head.getBytes ()); 


ut.write (body.getBytes ()) ; 


我 们 发 送 了 hello， 当 hello 没 有 收 到 ack 确 认 (TCP 是 可 靠 连接 ， 发 
送 的 每 一 个 数据 都 要 收 到 对 方 的 一 个 ack 和 确认 ， 否 则 就 要 重 发 ) 的 时 
候 ， 根 据 纳 格 算法 ，world 不 会 立马 发 送 ， 会 等 待 ， 要 么 等 到 ack 确 认 

(最 多 等 100ms 对 方 会 发 过 来 的 ) ， 要 么 等 到 TCP 缓 冲 区 内 容 > 
=MSS， 很 明显 这 里 没有 机 会 ， 我 们 写 了 world 后 再 也 没有 写 数据 了 ， 
所 以 只 能 等 到 hello 的 ack 我 们 才 会 发 送 world， 除 非 我 们 禁用 纳 格 算法 ， 
数据 就 会 立即 发 送 了 。 

SoLinger: 当 我 们 调用 socket.close () 返回 时 ，socket 已 经 write 的 
数据 未 必 已 经 发 送 到 对 方 了 ， 例 如 代码 清单 4-52 所 示 。 


代码 清单 4-.52 SoLinger 示例 
Socket socket = new Socket(); 
Socket.connect(new InetSocketAddress (host, 8000)); 
InputStream in = socket.getInputStream() ; 
OutputStream out = socket.getOutputStream() ; 
String head = "hello "; 
String body = "world\r\n"; 
out.write (head. getBytes () ) ; 
out.write (body. getBytes () ) ; 


socket.close(); 


这 里 调用 了 socket.close () 返回 时 ，hello 和 world 未 必 已 经 成 功 发 
送 到 对 方 了 ， 如 果 我 们 设置 了 linger 而 不 小 于 0， 如 代码 清单 4-53 所 示 。 


代码 清单 4-53 设置 linger 不 小 于 0 
bool on = true; 
int linger = 100; .... 
Socket.setSoLinger(boolean on, int linger) ...... 


Socket.close(); 


那么 close 会 等 到 发 送 的 数据 已 经 确认 了 才 返 回 。 但 是 如 果 对 方 宕 
机 ， 超 时 ， 那 么 会 根据 linger 设 定 的 时 间 返 回 。 

UrgentData 和 OOBInline: TCP 的 紧急 指针 ， 一 般 都 不 建议 使 用 ， 
而 且 不 同 的 TCP/IP 实 现 ， 也 不 同 ， 一 般 说 如 果 你 有 紧急 数据 宁愿 再 建 
立 一 个 新 的 TCP/IP 连 接 发 送 数据 ， 让 对 方 紧 急 处 理 。 

SoTimeout: 设置 socket 调 用 InputStream 读 数据 的 超时 时 间 ， 以 毫 
秒 为 单位 ， 如 果 超 过 这 个 时 候 ， 会 扫 出 
java.net.SocketTimeoutExceptiono 

KeepAlive: KeepAlive 不 是 说 TCP 的 常 连接 ， 当 我 们 作为 服务 端 ， 
一 个 客户 端 连接 上 来 ， 如 果 设 置 了 keeplive 为 tue， 当 对 方 没有 发 送 任 
何 数据 过 来 ， 超 过 一 个 时 间 〈 看 系统 内 核 参数 配置 ) ， 那 么 我 们 这 边 
会 发 送 一 个 ack 探 测 包 发 到 对 方 ， 探 测 双方 的 TCP/IP 连 接 是 否 有 效 (对 


v 


方 可 能 断 点 ， 断 网 ) ， 在 Linux 好 像 这 个 时 间 是 75 秒 。 如 果 不 设置 ， 那 
么 客户 端 宕 机 时 ， 服 务 器 永远 也 不 知道 客户 端 宕 机 了 ， 仍 然 保 存 这 个 
失效 的 连接 。 

SendBufferSize Wl ReceiveBufferSize: TCP 发送 缓存 区 和 接收 缓存 
区 ， 默 认 是 8192， 一 般 情况 下 足够 了 ， 而 且 就 算 你 增加 了 发 送 缓存 
区 ， 对 方 没有 增加 它 对 应 的 接收 缓冲 ， 那 么 在 TCP 三 握手 时 ， 最 后 确定 
的 最 大 发 送 窗口 还 是 双方 最 小 的 那个 缓冲 区 ， 就 算 你 无 视 ， 发 了 更 多 
的 数据 ， 那 么 多 出 来 的 数据 也 会 被 丢弃 。 除 非 双方 都 协商 好 。 


4.3.3 NIO2.0 文 件 系 统 


IO 技术 算得 上 是 开发 过 程 中 用 得 最 多 的 技术 之 一 ， 不 局 限于 Java 
语言 ， 在 任何 变 成 语言 中 MO 技术 都 被 广泛 运用 。 因 为 几乎 无 时 无 刻 开 
发 人 员 都 在 直接 或 者 间接 地 使 用 着 IO 技术 区 完成 各 式 各 样 的 需求 和 功 
能 。 从 技术 层面 上 来 说 ， 使 用 程序 读 写 磁盘 中 某 一 个 指定 的 文件 数 
据 、 与 数据 库 建 立会 话 执 行 CRUD 操 作 ， 甚 至 使 用 Socket 技 术 进 行 网 络 
通信 等 ， 这 些 技术 底层 都 需要 IO 技术 作为 支撑 。 

在 Java 中 ， 当 需要 读 取 目 标 数据 源 的 数据 时 ， 则 需要 开启 输入 流 ， 
反之 则 开启 输出 流 。 在 此 需要 注意 ， 数 据 源 涉及 较 广 ， 因 此 不 仅仅 只 
是 本 地 磁盘 文件 才 算 作 数 据 源 ， 内 存 和 网 络 等 载体 都 可 以 被 称 之 为 数 
据 源 。 

Java API 中 提供 了 两 种 类 型 的 数据 流 ， 分 别 是 字 节 流 〈 以 byte 为 单 
位 读 一 写 数 据 ) MSR (以 char 为 单位 读 写 数据 ) 。 字 节 流 为 处 理 字 
节 数 据 的 输入 /输出 提供 了 方便 的 方法 ， 常 用 于 写 二 进 制 数 据 。 而 字符 
流 则 为 处 理 字 符 数 据 的 输入 /输出 提供 了 方便 的 方法 ， 由 于 字符 流 采 用 
的 是 Unicode 编 码 格式 ， 因 此 字符 流 可 以 完美 地 支持 国际 化 。 并 且 在 某 
种 情况 下 ， 使 用 字符 流 相 对 于 字 节 流 而 言 更 为 高 效 ， 因 为 字 节 流 是 以 
byte 为 单位 ， 而 字符 流 以 char 为 单位 ， 字 符 流 不 仅 支 持 单 字符 的 读 / 写 操 
作 ， 还 支持 字符 数据 的 整 行 读 二 写 ， 这 一 点 是 字 节 流 无 法 做 到 的 。 但 
是 这 两 种 数据 流 各 有 所 长 ， 有 具体 应 该 使 用 什么 类 型 的 数据 流 ， 还 需要 
根据 具体 的 应 用 场景 来 决定 。 

早 在 Java4 版 本 中 推出 了 NIO (Java New Input/Output, ，Java 新 输入 
输出) 开始 ， 开 发 人 员 就 已 经 摆脱 了 阻塞 WO， 目前 较为 成 熟 的 第 三 


方 NIO 产 品 有 Mina、Netty 等 。 

Java NIO 的 非 阻 塞 数据 结构 能 够 让 应 用 程序 在 一 次 网 络 IO GR 
5) 操作 中 读 写 更 多 的 数据 。 我 们 知道 每 次 网 络 1/O 操 作 最 终 都 会 触发 
系统 调用 ， 导 致 系统 态 CPU 的 消耗 。 与 Java NIO 的 阻塞 式 数 据 结构 或 者 
更 传统 的 Java SE 阻 塞 式 数据 结构 〈 璧 如 java.net.Socket) 相 比 ，Java 
NIO 的 非 阻 塞 数据 结构 面临 的 最 大 挑战 是 编程 的 难度 较 大 。 例 如 ， 只 要 
不 超过 操作 系统 的 限制 ， 在 Java NIO 的 非 阻塞 输出 操作 中 ， 可 以 随心 所 
欲 地 写 入 任意 数量 的 数据 ， 但 这 需要 检查 输出 操作 的 返回 值 以 确定 你 
要 求 写 入 的 数据 的 确 已 经 被 写 入 了 。 即 只 要 有 数据 可 读 ， 一 次 Java NIO 
非 阻塞 输入 操作 中 可 以 读 取 任 意 数量 的 数据 ， 但 是 ， 你 同样 需要 检查 
最 终 读 取 了 多 少数 据 。 我 们 需要 实现 复杂 的 程序 逻辑 ， 处 理 读 取 协 议 
数据 单元 的 一 部 分 或 者 读 取 多 个 协议 数据 单元 的 情况 。 换 句 话说 ,一 
次 读 操作 读 到 的 数据 可 能 不 足以 构造 有 意义 的 协议 数据 单元 或 消息 。 
这 一 问题 在 阻塞 式 1O 中 很 容易 解决 ， 只 需要 等 待 直到 获取 足够 的 数据 
构造 完整 的 协议 数据 单元 或 消息 就 行 了 。 

实际 应 用 中 ， 是 否 需 要 转向 使 用 非 阻塞 WO 操 作 则 要 取决 于 应 用 程 
序 对 性 能 的 需求 。 如 果 你 想 要 利用 非 阻塞 Java NIO 带 来 的 性 能 提升 ， 应 
该 考虑 使 用 通用 的 Java NIO 框 架 ， 尽 量 减少 代码 迁移 的 代价 。 目 前 比较 
流行 的 Java NIO 框 架 有 Grizzly 和 Apache 的 MINA。 

Java7 提 出 了 全 新 的 文件 系统 NIO2.0， 利 用 NIO2.0， 开 发 人 员 则 无 
须 关 注 IO 细 节 ， 因 为 新 文件 系统 中 封装 有 大 量 的 通用 操作 ， 便 于 开发 
人 员 更 好 地 关注 自身 业务 。 并 且 在 IO 模型 方面 ， 将 支持 调用 操作 系统 
的 IOCP (Input/Output Completion Port， 输 入 二 输出 完成 端口 ) 接口 实 
现 真 正 的 异步 WO， 尽 可 能 避免 因 1/O 问 题 导致 的 系统 瓶颈 出 现 。NIO2.0 
API 改 变 了 针对 文件 管理 的 不 便 ， 使 得 在 java.nio.file 包 下 使 用 Path、 
Paths、Files、WatchService、FileSystem 等 这 几 个 常用 类 型 可 以 很 好 地 
减少 开发 人 员 对 文件 管理 的 编码 量 。 

Java7 还 为 开发 人 员 提 供 了 一 套 全 新 的 文件 系统 功能 ， 那 就 是 文件 
检测 。 以 Web 容 器 为 例 ， 当 项 目 迭 代 后 并 重新 部 署 时 ， 开 发 人 员 无 须 对 
其 进行 手动 重启 ， 因 为 Web 容 器 一 旦 检测 到 文件 发 生 改 变 后 ， 便 会 自动 
去 适应 这 些 变化 并 进行 相应 的 更 新 操作 。Web 容 器 的 热 发 布 功 能 就 是 基 


于 文件 检测 功能 ， 所 以 说 ， 文 件 检测 功能 的 出 现 对 于 Java 文 件 系统 来 说 
具有 重大 意义 。 

总 的 来 说 ， 对 于 网 络 I/O 有 一 些 基本 的 处 理 规则 如 下 : 

(1) 减少 交互 的 次 数 。 比 如 增加 缓存 ， 合 并 请 求 。 

(2) 减少 传输 数据 大 小 。 比 如 压缩 后 传输 、 约 定 合理 的 数据 协 
议 。 

(3) 减少 编码 。 比 如 提前 将 字符 转化 为 字 节 再 传输 。 

(4) 根据 应 用 场景 选择 合适 的 交互 方式 ， 同 步 阻塞 、 同 步 非 阻 
塞 、 异 步 阻塞、 异步 非 阻塞 。 


4.4 数据 应 用 优化 


数据 库 在 现代 软件 设计 里 一 直 保 持 着 较 高 的 使 用 率 ， 稍 大 一 点 的 
软件 都 逃 不 脱 数 据 存储 这 一 业务 逻辑 。 过 去 我 们 都 把 数据 存放 在 关系 
型 数据 库 ， 随 着 大 数据 需求 的 不 断 增多 ， 相 关 技 术 的 不 断 完善 ， 我 们 
越 来 越 需要 使 用 NoSQL 数 据 库 [7]， 这 一 节 以 HBase 为 例 ， 介 绍 如 何 快 
速 、 高 效 地 向 列 式 数据 库 插入 大 量 数 据 。 


4.4.1 关系 型 数据 库 优化 


关系 数据 库 访问 一 直 是 Java 平 台 的 重要 功能 ， 尤 其 对 Web 应 用 开发 
来 说 ， 大 多 数 Web 应 用 都 是 由 关系 数据 库 来 驱动 的 。Java 平 台 的 数据 库 
访问 方式 由 JDBC (Java Data Base Connectivity) 规范 来 定义 。JDBC 规 
范本 身 也 在 不 断 更 新 ， 以 适应 数据 库 技术 的 发 展 ， 同 时 满足 开发 人 员 
的 使 用 需求 。Java7 在 数据 库 访 问 方面 的 重要 更 新 是 增加 了 对 JDBC4.1 
规范 的 支持 ，Java6 支 持 的 仅 是 JDBC4.0 规 范 。 相 对 于 JDBC4.0 来 说 ， 
JDBC4.1 规 范 又 引入 了 一 些 新 的 特性 ， 这 些 特性 都 可 以 在 Java7 种 使 
用 ， 需 要 注意 的 是 ， 不 同 的 数据 库 实现 的 JDBC 驱 动 对 JDBC4.1 规 荡 的 
支持 程度 不 相同 的 。 特 定 的 数据 库 实现 有 可 能 暂时 还 不 支持 某 些 新 特 
性 。JDBC4.1 规 范 所 更 新 的 特性 在 java.sql 和 javax.sql 包 中 都 有 。 

与 数据 库 访 问 相 关 的 各 种 资源 ， 包 括 数据 库 连 接 、 查 询 语 句 和 结 
果 集 等 ， 都 可 以 用 try-with-resources 语 句 来 进行 管理 。 通 过 try-with- 


resources 语 句 可 以 去 掉 数 据 库 操作 时 对 close 方 法 的 调用 ， 大 大 降低 了 代 
人 码 的 复杂 性 。 在 Java7 中 ，java.sql & # BS java.sql.Connection , 
java.sql.Statement 和 java.sql.ResultSet 接口 都 Æ 承 了 
java.lang.AutoCloseable 接 口 ， 以 支持 由 try-with-resources 语 句 来 管理 。 
下 面 代码 给 出 了 使 用 try-with-resources 语 句 进行 数据 库 操作 的 示例 。 可 
以 把 对 Connection 、 Statement 和 ResultSet 的 创建 都 封装 在 try-with- 
resources 语 句 中 ， 这 样 就 不 用 考虑 这 些 对 象 的 关闭 操作 。 


代码 清单 4-54 try-with-resources 语句 示例 
public void doOperation() throws SQLException{ 
try(Connection connection = DriverManager.getConntection( 

"Jdbc:derby: //1ocalhost/javaTbook") ; 

Statement stmt = connection.createStatement(); 

ResultSet rs = stmt.executeQuery(" SELECT * FROM book”)) { 

while (rs.next())( 
System.out.println(rs.getString("name")); 


} 


} 


大 部 分 关系 数据 库 系统 都 支持 为 数据 库 中 包含 的 表 和 其 他 对 象 创 
建 一 个 额外 的 名 称 空 间 ， 即 模式 (schema) 。 一 个 模式 中 可 以 包含 
表 、 视 图 以 及 其 他 对 象 。 不 同 模式 中 可 以 有 名 称 相 同 的 表 或 视图 ， 而 
同一 模式 中 不 允许 有 名 称 相 同 的 对 象 存 在 。 通 过 SQL 语句 “CREATE 
SCHEMA” 可 以 创建 新 的 模式 。 当 访问 某 个 模式 中 包含 的 表 或 视图 等 对 
象 时 ， 需 要 使 用 模式 名 称 作为 前 缀 来 访问 ， 否 则 无 法 找到 相应 的 对 
象 。 比 如 ， 对 于 一 个 名 为 “DEMO_SCHEMA” 的 模式 中 的 “author” 表 ， 
在 SQL 语 句 中 应 该 使 用 “DEMO_SCHEMA.author” 来 引用 。 如 果 每 次 都 
要 加 上 模式 名 称 作 为 前 缀 ， 那 么 使 用 起 来 比较 麻烦 。JDBC4.1 为 
Connection 接 口 添加 了 一 对 新 的 方法 getSchema 和 setSchema， 用 来 获取 
和 设置 数据 库 操 作 时 使 用 的 默认 模式 名 称 。 当 通过 setSchema 进 行 设置 
之 后 ， 在 SQL 语句 中 就 不 再 需要 使 用 模式 名 称 作 为 前 级 了 。 如 代码 清 
单 4-55 所 示 ， 如 果 希 望 使 用 setSchema 方 法 ， 那 么 应 该 在 从 Connection 接 


口中 创建 出 来 的 Statement 对 象 被 使 用 之 前 进行 设置 ， 否 则 可 能 会 造成 
默认 的 模式 无 法 生效 。 


代码 清单 4.55 setSchema 方法 使 用 方式 
public void setSchema() throws SQLException{ 
try (Connectionconnection-DriveManager.getConnection ("jdbc:derby://localhost/ja 
vaTIbook") ) ( 
connection.setSchema ("DEMO SCHEMA"); 
try(Statement stmt = connection.createStatement () 
ResultSet rs = stmt.executeQuery(“SELCT * FROM author"))[ 
while (rs.next ()) { 


System.out.println(rs.getString("name)); 


} 
} 


在 使 用 数据 库 连 接 时 会 遇 到 的 一 个 问题 是 ， 网 络 连接 出 现 问题 造 
成 数据 库 连 接 中 断 。 当 数据 库 连 接 中 断 时 ， 可 能 会 造成 发 出 数据 库 操 
作 命 令 的 线程 在 较 长 时 间 内 处 于 等 待 状态 。 具 体 的 等 待 时 间 取 决 于 TCP 
连接 的 超时 时 间 设 置 。 这 个 超时 时 间 一 般 会 长 达 几 分 钟 。 也 就 是 说 ， 
在 数据 库 操作 命令 发 出 之 后 ， 可 能 需要 等 待 几 分 钟 才 能 得 知 数据 库 连 
接 已 经 中 断 了 。 对 于 一 个 数据 库 应 用 来 说 ， 几 分 钟 的 等 待 时 间 过 长 ， 
为 此 ，JDBC4.1 添 加 了 对 数据 库 连 接 超过 的 处 理 方式 ， 主 要 是 在 
Connection 接 口中 新 增 了 setNetworkTimeout 和 abort 两 个 方法 。 

Connection 接 口 的 setNetworkTimeonut 方 法 用 来 设置 通过 此 数据 库 连 
接 进行 数据 库 操作 时 的 超时 等 待 时 间 。 如 果 远 程 数 据 库 没 有 在 给 定 的 
时 间 内 返回 操作 结果 ， 那 么 会 认为 该 连接 已 经 关闭 ， 无 法 再 继续 使 
用 ， 处 于 等 待 状态 的 数据 库 操作 方法 则 会 抛 出 SQLException 异 常 来 表 
示 这 种 超时 的 情况 。 对 一 个 Connection 接 口 的 实现 对 象 设置 要 包括 
Statement 和 java.sql.PreparedStatement 接 口 的 实现 对 象 。 通 过 Statement 和 和 
java.sql.PreparedStatement 接 口 的 实现 对 象 执行 的 查询 操作 也 适用 于 
Connection 接 口 的 实现 对 象 上 设置 的 超时 等 待 时 间 。 可 以 多 次 调用 


setNetworkTimeout 方 法 ， 以 对 不 同 的 情况 设置 不 同 的 超时 时 间 。 对 于 
同一 个 Connection 接 口 的 实现 对 象 ， 如 果 预 计 某 些 查询 操作 比较 耗 时 ， 
可 以 把 超时 等 待 时 间 设 置 为 一 个 较 大 的 值 ， 等 操作 完成 之 后 ， 再 恢复 
一 个 对 大 多 数 操作 都 适用 的 较 小 值 。 

与 setNetworkTimeout 相 关 的 方法 abort 用 来 强制 关闭 一 个 数据 库 连 
接 ， 当 调用 一 个 Connection 接 口 的 实现 对 象 的 abort 方 法 时 ， 这 个 数据 库 
连接 会 被 标记 为 关闭 状态 ， 同 时 与 该 连接 相关 的 资源 都 会 被 释放 ， 另 
外 ， 当 前 正在 使 用 该 连接 的 方法 会 抛 出 SQLException 异 常 。 从 作用 上 
讲 ，abort 方 法 类 似 于 Connection 接 口中 已 有 的 close 方 法 ， 但 是 两 者 的 使 
用 场景 不 同 。dlose 方 法 一 般 是 由 Connection 接 口 的 使 用 者 来 调用 的 ， 当 
一 个 使 用 者 完成 数据 库 操作 之 后 ， 可 以 通过 close 方 法 来 关闭 此 数据 库 
连接 。 而 abort 方 法 一 般 由 数据 库 连 接 的 管理 者 调用 ， 如 果 发 生 了 前 面 
提 到 的 由 于 网 络 问 题 造成 数据 库 连 接 中 断 的 情况 ， 连 接 的 管理 者 在 检 
测 到 问题 发 生 之 后 ， 可 以 调用 abort 方 法 来 强制 终止 此 连接 ， 该 连接 的 
使 用 者 也 不 需要 等 待 数 据 库 操作 的 完成 即 可 进入 到 SQLException 异 常 
的 处 理 阶段 。 

setNetworkTimeout 和 abort A 法 都 接收 — 个 
java.util.concurrent.Executor 接 口 的 实现 对 象 作 为 参数 。 这 个 Executor 接 
口 的 实现 对 象 用 来 执行 方法 调用 中 可 能 会 出 现 的 相关 任务 。 对 于 abort 
万 法 来 说 ， 在 终止 数据 库 连 接 的 过 程 中 需要 释放 相关 的 资产 。 释 放 资 
源 的 相关 任务 由 该 Exector 接 口 的 实现 对 象 来 执行 。 当 abort 方 法 返回 之 
后 ，Executor 接 口 的 实现 对 象 可 能 仍 在 继续 执行 相关 的 任务 。 下 面 代码 
给 出 了 abort 方 法 的 使 用 示例 。 为 了 查看 在 abort 方 法 调用 过 程 中 执行 的 
jd X (f£ $8, x HB fé dr — Tt Bx X 的 
java.util.concurrent.ThreadPoolExecutor 类 的 实现 。 在 任务 被 执行 之 前 ， 
会 在 控制 台 输 出 相关 的 提示 信息 。 在 运行 过 程 中 可 以 发 现 ， 在 调用 
abort 方 法 之 后 ， 有 新 的 任务 被 添加 到 Exectuor 接 口 的 实现 对 象 中 执行 ， 
见 代码 清单 4-56。 


代码 清单 4-56 “强制 关闭 连接 
public class AbortConnection{ 
public void abortConnection() throws SQLException( 
Connection connection - 
DriverManager.getConnection ('jdbc: derby: / / 1ocalhost/java Tbook") ; 
ThreadPoolExecutor executor - new 
DebugExecutorService (2,10,60, TimeUnit.SECONDS, new LinkedBlockingQueue«Runnable» ()) ; 
connection.abort (executor); 
executor.shutdown(); 
try{ 
executor.awaitTermination(5,TimeUnit.MINUTES); 
catch (InterruptedException e) { 


e.printStackTrace () ; 


private static class DebugExecutorService extends ThreadPoolExecutor{ 
public DebugExecutorService(int corePoolSize,int maximumPoolSize, long 
keepAliveTime,TimeUnit unit, BlockingQueue<Runnable> workQueue) { 


super (corePoolSize, maximumPoolSize, keepAliveTime, unit, workQueue) ; 


public void beforeExecute (Thread t,Runnable r) { 
System,out,println (“清理 任务 :”+r.getClass () ) ; 


super.beforeExecute (t, r) ; 


} 


在 JDBC4.1 之 前 ， 当 使 用 一 个 Statement 接 口 的 实现 对 象 进 行 查询 , 
得 到 表示 结果 集 的 ResultSet 接 口 的 实现 对 象 并 完成 处 理 之 后 ， 需 要 显 式 


地 通过 close 方 法 来 关闭 ResultSet 和 Statement 接 口 的 实现 对 象 以 释放 资 
源 。 使 用 Java7 的 try-with-resources 语 句 可 以 简化 这 个 操作 ， 而 更 好 的 办 
法 是 使 用 JDBC4.1 为 Statement 接 口 添 加 的 自动 关闭 功能 。 在 调用 了 
Statement 接 口 的 closeOnCompletion 方 法 之 后 ， 表 明 当 依赖 此 Statement 
接口 的 实现 对 象 的 所 有 结果 集 都 被 关闭 之 后 ， 该 Statement 接 口 的 实现 
对 象 也 被 自动 关闭 。 通 过 这 种 方式 ， 开 发 人 员 只 需 显 式 地 关闭 结果 集 
即 可 ， 不 需要 考虑 Statement 接 口 的 实现 对 象 本 身 的 关闭 问题 。 这 个 新 
特性 在 Statement 接 口 的 实现 对 象 作 为 参数 在 多 个 方法 中 传递 时 尤为 实 
用 。 当 代码 中 的 多 个 地 方 都 使 用 了 相同 的 Statemenet 接 口 的 实现 对 象 来 
打开 结果 集 时 ， 以 前 需要 设计 好 由 哪个 方法 来 关闭 该 Statement 接 口 的 
实现 对 象 ， 而 使 用 这 个 自动 关闭 功能 之 后 ， 每 个 方法 只 需要 关闭 该 方 
法 内 部 打开 的 结果 集 即 可 ， 不 需要 考虑 Statement 接 口 的 实现 对 象 自身 
的 关闭 问题 。 

javax.sqlL.RowSet 接 口 是 JDBC2.0 引 入 的 表格 式 数 据 的 抽象 表示 形 
式 。RowSet 接 口 继承 自 ResultSet 接 口 ， 并 在 ResultSet 接 口 的 基础 上 添加 
了 属性 设置 和 变化 通知 相关 的 功能 。RowSet 接 口 是 符 合 JavaBeans 组 件 
规范 的 ， 可 以 与 其 他 JavaBeans 组 件 协同 使 用 。RowSet 接 口 的 使 用 者 并 
不 需要 显 式 地 管理 数据 库 连 接 ， 只 需要 把 数据 库 相 关 的 连接 信息 以 属 
性 的 方式 设置 到 RowSet 接 口 的 实现 对 象 中 即 可 。RowSet 接 口 的 实现 会 
负责 处 理 数据 库 连 接 的 相关 工作 。RowsSet 接 口 有 5 个 不 同 的 子 接口 ， 每 
个 子 接口 实现 所 适应 的 场景 不 同 。 每 个 子 接口 对 应 的 具体 实现 类 也 有 
不 少 ， 分 别 来 自 不 同 的 提供 者 。 在 Java7 之 前 并 没有 一 个 规范 的 方式 来 
管理 RowSet 接 口 的 实现 对 象 的 创建 ， 开 发 人 员 需 要 直接 根据 实现 类 的 
类 名 来 创建 新 的 RowSet 接 口 的 实现 对 象 。 这 种 直接 依赖 具体 类 而 不 是 
接口 的 做 法 ， 不 利于 代码 的 移植 和 维护 。 

Java7 对 RowSet 接 口 的 实现 对 象 的 创建 做 了 更 新 ， 采 用 了 Java 标 准 
的 服务 提供 者 接口 (Service Provider Interface, SPI) 机 制 。 使 用 者 通 
过 工厂 方法 来 创建 具体 的 RowSet 接 口 的 实现 对 象 ， 而 工厂 对 象 本 身 由 
RowSet 实 现 的 提供 者 注册 到 Java 平 台 上 。 具 体 的 工厂 对 象 的 查找 和 创 
建 是 由 javax.sql.rowset.RowSetProvider 类 的 静态 方法 来 完成 的 ， 具 体 的 
工厂 对 象 则 实现 javax.sql.rowset.RowSetFactory 接 口 。 RowSetFactory 接 
口 提 供 了 5 种 不 同 RowSet 接 口 实现 的 创建 方法 。 下 面 的 代码 给 出 了 使 用 
javax.sql.rowset.JdbcRowSet 实 现 的 示例 ， 从 中 可 以 看 到 RowSet 接 口 的 


基本 用 法 ， 数 据 库 连接 字符 串 和 SQL 语句 都 是 以 属性 的 方式 来 进行 设 
置 的 。 


代码 清单 4-57 JdbcRowSet 示例 

public void useRowSet() throws SQLException{ 

RowSetFactory rsFactory = RowSetProvider.newFactory(); 

try(JdbcRowSet jrs = rsFactory.createJdbcRowSet () ) ( 
jrs.setUrl("jdbc:derby://1localhost/javaTbook") ; 
jrs.setCommand("SELECT * FROM book"); 
jrs.execute() ; 
jrs.absolute(1); 
jrs.updateString ("name","New book"); 
jrs.updateRow() ; 

} 

} 


除了 上 面 介绍 的 几 个 比较 重要 的 更 新 之 外 ，JDBC4.1 还 有 一 些 比较 
小 的 更 新 。 这 些小 更 新 包括 ， 在 使 用 ResultSet 中 的 getObject 方 法 时 ， 可 
以 直接 把 结果 类 型 的 Java 类 作为 参数 传递 进去 ， 而 不 需要 在 调用 之 后 在 
进行 强制 类 型 转换 。 比 如 ， 之 前 的 调用 方式 是 * (String) rs.getObject 
(1) ”， 新 的 调用 方式 是 “rs.getObject (1, String.class) "; 表示 数据 库 
中 元 数据 的 java.sql.DatabaseMetaData 接 口中 新 增 了 getPseudoColumns 方 
法 来 获取 数据 库 表 中 包含 的 伪 列 (pseudo column) 和 隐藏 列 (hidden 
column) 的 元 数据 。 伪 列 指 的 是 不 在 数据 库 表 结构 中 定义 但 可 以 在 查 
询 中 使 用 伪 列 “ROWNUM” 来 获取 当前 行 的 行 号 ， 类 似 的 伪 列 还 有 获取 
当前 日 期 和 时 间 改 <SYSDATE” 和 “SYSTIMESTAMP”。 隐 藏 列 通 常用 来 
保存 一 些 与 数据 库 相 关 的 内 部 信息 。getPseudoColumns 方 法 的 返回 值 是 
ResultSet 接 口 的 实现 对 象 ， 其 中 的 每 一 行 都 包含 了 查找 到 的 伪 列 和 隐藏 
列 的 名 称 、 数 据 类 型 、 大 小 等 信息 。 如 果 通 过 Statemenet 接 口 的 
setQueryTimeonut 方 法 设置 了 数据 库 查询 的 超时 等 待 时 间 ， 那 么 当 操作 
超时 的 时 候 ， 会 抛 出 更 加 具体 的 java.sql.SQLTimeoutException 异 常 ， 而 
不 是 通用 的 SQLException 异 常 。 


在 使 用 JDBC4.1 时 ， 需 要 检测 所 增加 的 新 特性 是 否 已 经 被 关系 数据 
库 实现 支持 。 不 同 的 关系 数据 库 实现 在 对 JDBC 规 范 的 支持 上 可 能 有 所 
不 同 。 在 使 用 J]JDBC4.1 的 新 特性 之 前 ， 先 查看 一 下 所 使 用 的 数据 库 和 驱 
动 的 相关 信息 ， 以 确定 对 JDBC4.1 规 范 的 支持 程度 。 


4.4.2 向 HBase 插 入 大 量 数 据 


随 着 业务 数据 的 不 断 增 加 ， 特 别 是 非 结 构 化 数据 的 不 断 增 长 ， 所 
以 传统 的 关系 型 数据 库 已 经 不 能 应 付 现 有 的 需求 ， 迫 切 需要 使 用 列 示 
数据 库 。HBase 数 据 库 是 一 个 基于 分 布 式 的 、 面 向 列 的 、 主 要 用 于 非 结 
构 化 数据 存储 用 途 的 开源 数据 库 。 其 设计 思路 来 源 于 Google 的 非 开 源 
INGE” BigTable”. 

我 们 本 节 需 要 解决 如 何 向 HBase 数 据 库 导入 数据 的 问题 及 优化 策 
略 ， 首 先 介绍 一 点 HBase 数 据 库 的 基础 知识 。 

HBase 的 Rowkey 是 数据 行 的 唯一 标识 ， 必 须 通 过 它 进行 数据 行 访 
问 ， 目 前 有 三 种 方式 ， 单 行 键 访问 、 行 键 范围 访问 、 全 表 扫 描 访问 。 
数据 按 行 键 的 方式 排序 存储 ， 依 次 按 位 比较 ， 数 值 较 大 的 排列 在 后 ， 
例如 int 方 式 的 排序 : 1, 10, 100, 11, 12, 2, 20..., 906, ...o 

ColumnFamily 是 “ 列 族 ”， 属 于 schema 表 ， 在 建 表 时 定义 ， 每 个 列 
属于 一 个 列 族 ， 列 名 用 列 族 作为 前 缀 “ColumnFamily: qualifier”， 访 问 
控制 、 磁 盘 和 内 存 的 使 用 统计 都 是 在 列 族 层 面 进行 的 。 

Cel] 是 通过 行 和 列 确 定 的 一 个 存储 单元 ， 值 以 字 节 码 存储 ， 没 有 类 
2m 

Timestamp 是 区 分 不 同 版 本 Cell 的 索引 ，64 位 整 型 。 不 同 版 本 的 数 
据 按照 时 间 戳 倒序 排列 ， 最 新 的 数据 版 本 排 在 最 前 面 。 

HBase 在 行 方向 上 水 平 划 分 成 N 个 Region， 每 个 表 一 开始 只 有 一 
Region， 数 据 量 增多 ，Region 自动 分 裂 为 两 个 ， D cl 
同 Server 上 ， 但 同一 个 不 会 拆 分 到 不 同 Servero 

Region 按 ColumnFamily 划 分 成 Store，Store 为 最 小 存储 单元 ， 用 于 
保存 一 个 列 族 的 数据 ， 每 个 Store 包 括 内 存 中 的 memstore 和 持久 化 到 disk 
上 的 HFile。 


数据 导入 到 HBase， 我 们 必须 考虑 分 布 式 环境 下 的 数据 合并 问题 ， 
而 数据 合并 问题 一 直 是 HBase 的 难题 ， 因 为 数据 合并 需要 频繁 执行 写 操 
作 任 务 ， 解 决 方案 是 我 们 可 以 通过 生成 HBase 的 内 部 数据 文件 ， 这 样 可 
以 做 到 直接 把 数据 文件 加 载 到 HBase 数 据 库 对 应 的 数据 表 。 这 样 的 做 法 
确实 写 入 HBase 的 速度 很 快 ， 但 是 如 果 合 并 过 程 中 HBase 的 配置 如 果 不 
是 很 正确 ， 可 能 会 造成 写 操 作 阻塞 。 目 前 我 们 常用 的 数据 导入 方法 有 
HBase Client 调 用 方式 、MapReduce 任 务 方式 、Bulk Load 工 具 方 式 、 
Sqoop 工 具 方 式 这 四 种 。 

几 种 方式 都 可 以 通过 HFile 的 帮助 做 到 快速 数据 导入 ， 我 们 首先 在 
这 里 先 给 出 生成 HFile 的 Java 代 码 ， 后 面 各 个 方法 内 部 再 按照 各 自 方式 
插入 HFile 文 件 到 HBase 数 据 库 。 如 代码 清单 4-58 所 示 。 运 行 代码 后 生成 
的 HFile 文 件 放 着 后 面 要 用 。 


代码 清单 4-58 生成 HFile 
import org.apache.hadoop.conf.Configuration; 
import org.apache.hadoop.fs.Path; 
import org.apache.hadoop.hbase.HBaseConfiguration; 
import org.apache.hadoop.hbase.KeyValue; 
import org.apache.hadoop.hbase.client.HTable; 
import org.apache.hadoop.hbase.io.ImmutableBytesWritable; 
import org.apache.hadoop.hbase.mapreduce.HFileOutputFormat; 
import org.apache.hadoop.hbase.mapreduce.KeyValueSortReducer; 
import org.apache.hadoop.io.LongWritable; 
import org.apache.hadoop.io.Text; 
import org.apache.hadoop.mapreduce.Job; 
import org.apache.hadoop.mapreduce.Mapper; 
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat; 
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; 


import java.io.IOException; 


public class generateHFile { 
public static class generateHFileMapper extends Mapper«LongWritable, Text, 
ImmutableBytesWritable, KeyValue> { 
@Override 
protected void map(LongWritable key, Text value, Context context) 
throws IOException, InterruptedException { 
String line = value.toString(); 


String[] items = line.split(",", -1); 


ImmutableBytesWritable rowkey = new 
ImmutableBytesWritable (items [0] .getBytes()); 

KeyValue kvProtocol = new KeyValue (items [0] ,getBytes (), 
"colfaml".getBytes(), "colfaml".getBytes(), items[0].getBytes()); 

if (null != kvProtocol) { 


context.write(rowkey, kvProtocol); 


public static voidmain(String[] args) throws IOException, InterruptedException, 

ClassNotFoundException { 

Configuration conf = HBaseConfiguration.create(); 

System.out .println("conf-"4conf); 

HTable table = new HTable(conf, "testtablel"); 

System.out.println("table-"4table); 

Job job = new Job(conf, "generateHFile"); 

job.setJarByClass (generateHFile.class); 

job.setOutputKeyClass (ImmutableBytesWritable.class) ; 

job. setOutputValueClass (KeyValue.class) ; 

job. setMapperClass (generateHFileMapper.class) ; 

job. setReducerClass (KeyValueSortReducer.class) ; 

job. setOutputFormatClass (HFileOutputFormat.class); / / 28 A HFile X4f 

HFileOutputFormat.configureIncrementalLoad (job, table); // 844} job 进行 配置 ， 
SimpleTotalOrderPartitioner 是 需要 先 对 key 进行 整体 排序 ， 然 后 划分 到 每 个 reduce 中 ， 保 证 每 一 个 
reducer 中 的 的 key 最 小 最 大 值 区 间 范 围 ， 是 不 会 有 交集 的 。 

FileInputFormat.addInputPath(job, new Path(args[0])); 

FileOutputFormat.setOutputPath(job, new Path(args[1])); 

System.exit(job.waitForCompletion(true) ? 0 : 1); 


使 用 HBase 的 API 中 的 Put 方 法 是 最 直接 的 数据 导入 方式 ， 该 方式 的 
缺点 是 当 需 要 将 海量 数据 在 规定 时 间 内 导入 HBase 中 时 ， 需 要 消耗 较 大 
的 CPU 和 网 络 资源 ， 所 以 这 个 方式 适用 于 数据 量 较 小 的 应 用 环境 。 使 
用 Put 方 法 将 数据 插入 HBase 中 的 方式 ， 由 于 所 有 的 操作 均 是 在 一 个 单 
独 的 客户 端 执行 ， 所 以 不 会 使 用 到 MapReduce 的 job 概 念 ， 即 没有 任务 
的 概念 ， 所 有 的 操作 都 是 逐条 插入 到 数据 库 中 的 。 大 致 的 流程 可 以 分 
解 为 HBase Client 调 用 HTable 类 访问 到 HMaster 的 原 数据 保存 地 点 ， 然 后 
通过 找到 相应 的 Region Server， 并 分 配 具 体 的 Region， 最 后 操作 到 
HFile 这 一 层级 。 当 连接 上 HRegionServer 后 ， 首 先 获得 锁 ， 然 后 调用 
HRegion 类 对 应 的 put 命 令 开 始 执行 数据 导入 操作 ， 数 据 插入 后 还 要 写 
AJE, 5 Hlog, WAL (Write Ahead Log) 、Hmemstore。 具 体 实现 如 
代码 清单 4-59 所 示 ， 在 代码 中 我 们 尝试 插入 了 10 万 条 数据 ， 打 印 出 插入 
过 程 消耗 的 时 间 。 


代码 清单 4-59 采用 HBase Client 方式 代码 
import org.apache.hadoop.conf.Configuration; 
import org.apache.hadoop.hbase.HBaseConfiguration; 


import org.apache.hadoop.hbase.client.HTable; 


import org.apache.hadoop.hbase.client.Put; 


import org.apache.hadoop.hbase.util.Bytes; 
import java.io.IOException; 
public class PutDemo { 


public static void main(String[] args) throws IOException { 
//4|3£ HBase 上 下 文 环境 
Configuration conf = HBaseConfiguration.create(); 
System.out.println("conf-"-*conf); 


int count=0; 


HBaseHelper helper - HBaseHelper.getHelper (conf); 
System.out.println("helper-"-helper); 
helper.dropTable ("testtablel"); 
helper.createTable("testtablel", "colfaml"); 


HTable table - new HTable(conf, "testtablel"); 
long start = System.currentTimeMillis(); 
for(int i-1;i«100000;i-4-4)( 
/ / ik €. rowkey 的 值 
Put put = new Put (Bytes.toBytes ("row"+i) ); 
// ik € family: qualifier:value 
put.add(Bytes.toBytes("colfaml"), Bytes.toBytes("quall"), 
Bytes.toBytes ("vall")); 
put.add(Bytes.toBytes("colfam1"), Bytes.toBytes ("qual2"), 
Bytes.toBytes ("val2")); 
// 调 用 put 方法 ， 插 入 数据 导 HBase 数据 表 testtablel 里 
table.put (put); 
countt++; 
if (count%10000==0) { 
System.out.println("Completed 10000 rows insetion") ; 


System.out.println(System.currentTimeMillis() - start); 


清单 4-60 HBaseHelper 类 代码 部 分 相关 代码 


import org.apache.hadoop.conf.Configuration; 
import org.apache.hadoop.hbase.HBaseConfiguration; 
import org.apache.hadoop.hbase.HColumnDescriptor; 
import org.apache.hadoop.hbase.HTableDescriptor; 
import org.apache.hadoop.hbase.KeyValue; 

import org.apache.hadoop.hbase.client.Get; 

import org.apache.hadoop.hbase.client.HBaseAdmin; 


import org.apache.hadoop.hbase.client.HTable; 
import org.apache.hadoop.hbase.client.Put; 
import org.apache.hadoop.hbase.client.Result; 
import org.apache.hadoop.hbase.util.Bytes; 


import java.io.IOException; 
import java.util.ArrayList; 
import java.util.List; 


import java.util.Random; 


/** 
* Used by the book examples to generate tables and fill them with test data. 
kf 
public class HBaseHelper { 
// 在 Java 代码 中 ,为 了 连接 到 HBase， 我 们 首先 创建 一 个 配置 (Configuration ) 对 象 ， 使 用 该 对 象 创 
建 一 个 HTable 实例 。 这 个 HTable 对 象 用 于 处 理 所 有 的 客户 端 RPI 调用 。 
private Configuration conf = null; 


private HBaseAdmin admin - null; 


protected HBaseHelper(Configuration conf) throws IOException { 
this.conf - conf; 


this.admin = new HBaseAdmin(conf); 


public static HBaseHelper getHelper(Configuration conf) throws IOException { 
return new HBaseHelper (conf); 
} 
public void put(String table, String row, String fam, String qual, long ts, 
String val) throws IOException { 
HTable tbl = new HTable(conf, table); 
Put put = new Put (Bytes.toBytes (row) ); 
put.add(Bytes.toBytes(fam), Bytes.toBytes(qual), ts, 
Bytes.toBytes (val) ); 
tbl.put (put); 
tbl.close(); 


public void put(String table, String[] rows, String[] fams, String[] quals, 
long[] ts, String[] vals) throws IOException { 
HTable tbl - new HTable(conf, table); 
for (String row : rows) { 
Put put = new Put(Bytes.toBytes (row) ); 
for (String fam : fams) { 
int v = 0; 
for (String qual : quals) { 
String val - vals[v « vals.length ? v : vals.length]; 
long t = ts[v < ts.length ? v : ts.length - 1]; 
put.add(Bytes.toBytes(fam), Bytes.toBytes(qual), t, 


Bytes.toBytes (val)); 


Vtt; 


} 
tbl.put (put); 


} 
tbl.close(); 


String[] rows, String[] fams, String[] quals) 


public void dump(String table, 


throws IOException { 
HTable tbl = new HTable(conf, 
new ArrayList<Get>(); 


table); 


List<Get> gets = 
for (String row : rows) { 
new Get (Bytes.toBytes (row) ); 


Get get = 
get.setMaxVersions (); 
if (fams != null) { 


for (String fam : fams) { 
for (String qual : quals) { 


get.addColumn (Bytes.toBytes (fam), Bytes.toBytes (qual) ); 


} 
gets.add(get) ; 
} 
Result[] results = tbl .get (gets); 
for (Result result : results) { 
for (KeyValue kv : result.raw()) { 


System.out.println("KV: " + kv + 


", Value: " + Bytes.toString(kv.getValue())); 


public void dropTable(String table) throws IOException { 


if (existsTable(table)) { 
disableTable (table); 
admin.deleteTable (table) ; 


public void put(String table, String row, String fam, String qual, long ts, 


String val) throws IOException { 


HTable tbl = new HTable(conf, table); 


new Put (Bytes.toBytes (row) ); 


Put put = 
Bytes.toBytes (qual), ts, 


put.add(Bytes.toBytes (fam), 


Bytes.toBytes (val)); 
tbl.put (put) ; 
tbl.close(); 
} 


如 果 需 要 通过 编程 来 生成 数据 ， 那 么 用 importtsv 工 具 不 是 很 方便 ， 
这 时 候 可 以 使 用 MapReduce 向 HBase 导 入 数据 ， 但 海量 的 数据 集会 让 
MapReduce Job 变 得 很 繁重 ， 若 处 理 不 当 ， 则 可 能 使 得 MapReduce 的 job 
运行 时 的 吞吐 量 很 小 。 由 于 MapReduce 在 写 HBase 是 采用 的 是 
TableOutputFormat 方 式 ， 这 样 在 写 入 数据 库 的 时 候 容 易 对 写 入 块 进行 频 
繁 的 刷新 、 分 割 、 合 并 操作 ， 这 些 操作 都 是 较为 耗费 磁盘 WO 的 操作 ， 
最 终 导致 HBase 节 点 的 不 稳定 性 。 前 面 介 绍 过 生成 HFile 的 代码 ， 生 成 
HFile 后 ， 我 们 可 以 采用 MapReduce 方 式 把 数据 导入 到 HBase 数 据 表 里 ， 
具体 如 代码 清单 4-61 所 示 。 


清单 4-61 MapReduce 方式 导入 HFile 到 HBase 数据 表 


import java.io.IOException; 

import org.apache.commons.logging.Log; 

import org.apache.commons.logging.LogFactory; 

import org.apache.hadoop.conf.Configuration; 

import org.apache.hadoop.conf.Configured; 

import org.apache.hadoop.hbase.HBaseConfiguration; 

import org.apache.hadoop.hbase.client.HTable; 

import org.apache.hadoop.hbase.client.Put; 

import org.apache.hadoop.hbase.util.Bytes; 

import org.apache.hadoop.io.LongWritable; 

import org.apache.hadoop.io.NullWritable; 

import org.apache.hadoop.io.Text; 

import org.apache.hadoop.mapreduce.Job; 

import org.apache.hadoop.mapreduce.Mapper; 

import org.apache.hadoop.mapreduce.lib.input.TextInputFormat; 
import org.apache.hadoop.mapreduce.lib.output.NullOutputFormat; 
import org.apache.hadoop.util.GenericOptionsParser; 

import org.apache.hadoop.util.Tool; 


import org.apache.hadoop.util.ToolRunner; 


public class HBaseImportByMapReduce extends Configured implements Tool { 
static final Log LOG = LogFactory.getLog (HBaseImportByMapReduce.class) ; 
public static final String JOBNAME = "MapReduceImport"; 
public static class Map extends Mapper<LongWritable , Text, NullWritable, 
NullWritable>{ 
Configuration configuration = null; 
HTable xTable = null; 


static long count = 0; 


@Override 
protected void cleanup (Context context) throws IOException, InterruptedException { 
// TODO Auto-generated method stub 
super.cleanup (context); 


xTable.flushCommits (); 


xTable.close(); 


GOverride 
protected void map(LongWritable key, Text value, Context context) throws 
IOException, InterruptedException { 
String all[] = value.toString().split("/t"); 
Put put = new Put (Bytes.toBytes(all1[0])); 
put.add(Bytes.toBytes("colfaml1"),Bytes.toBytes("valuel"), null); 
xTable.put (put); 
if ((++count $ 100)==0) { 
context.setStatus (count +" DOCUMENTS done!"); 
context.progress(); 
System.out.println(count +" DOCUMENTS done!"); 


GOverride 

protected void setup(Context context) throws IOException,InterruptedException { 
// TODO Auto-generated method stub 
super.setup (context); 
configuration - context.getConfiguration(); 
xTable = new HTable(configuration,"testtable2"); 
xTable.setAutoFlush(false); 
xTable.setWriteBufferSize(12*1024*1024); 


@Override 

public int run(String[] args) throws Exception { 
String input = args[0]; 
Configuration conf = HBaseConfiguration.create(getConf()); 
conf.set("hbase.master", "node1:60000"); 
Job job = new Job (conf, JOBNAME) ; 
job.setJarByClass (HBaseImportByMapReduce.class) ; 
job.setMapperClass (Map.class) ; 
job.setNumReduceTasks (0) ; 
job.setInputFormatClass (TextInputFormat.class) ; 
TextInputFormat.setInputPaths (job, input); 
job.setOutputFormatClass (NullOutputFormat.class); 


return job.waitForCompletion (true) ?0:1; 


public static void main(String[] args) throws IOException { 
Configuration conf = new Configuration () ; 


String[] otherArgs = new GenericOptionsParser(conf, args) .getRemainingArgs (); 


int res = 1; 
try { 
res = ToolRunner.run(conf, new HBaseImportByMapReduce(), otherArgs); 
} catch (Exception e) { 
e.printStackTrace(); 
} 


System.exit (res); 


} 


MapReduce 方 式 启动 任务 需要 一 些 时 间 ， 如 果 数 据 量 较 大 ， 整 个 
Map 过 程 也 会 消耗 较 多 时 间 。 其 实 一 般 来 说 MapReduce 方 式 和 后 面 要 介 
绍 的 Bulk Load 方 式 是 配合 使 用 的 ，MapReduce 负 责 生 成 HFile 文 件 ， 
Bluk Load 负 责 导 入 HBase。 


总 的 来 说 ， 使 用 Bluk Load 方 式 由 于 利用 了 HBase 的 数据 信息 是 按 
照 特 定格 式 存 储 在 HDFS 里 的 这 一 特性 ， 直 接 在 HDFS 中 生成 持久 化 的 
HFile 数 据 格 式 文件 ， 然 后 完成 巨 量 数据 快速 入 库 的 操作 ， 配 合 
MapReduce 完 成 这 样 的 操作 ， 不 占用 Region 资 源 ， 不 会 产生 巨 量 的 写 入 
IO， 所 以 需要 较 少 的 CPU 和 网 络 资源 。Bluk Load 的 实现 原理 是 通过 一 
个 MapReduce Job 来 实现 的 ， 通 过 Job 直 接生 成 一 个 HBase 的 内 部 HFile 格 
式 文 件 ， 用 来 形成 一 个 特殊 的 HBase 数 据 表 ， 然 后 直接 将 数据 文件 加 载 
到 运行 的 集群 中 。 使 用 Bulk Load 功 能 最 简单 的 方式 就 是 使 用 importtsv 
工具 ，importtsv 是 HBase 的 一 个 内 置 工具 ， 目 的 是 从 TSV 文 件 直接 加 载 
内 容 至 HBase。 它 通过 运行 一 个 MapReduce Job ， 将 数据 从 TSV 文 件 中 
直接 写 入 HBase 的 表 或 者 写 入 一 个 HBase 的 自 有 格式 数据 文件 ， 最 后 提 
供 CompleteBulkLoad 国 数 导 入 HBase。 


代码 清单 4-62 MapReduce 方式 导入 HFile 到 HBase 数据 表 

创建 生成 文件 的 文件 夫 ， 

SHADOOP HOME/bin/hadoop fs -mkdir /user/hac/output 

开始 导入 数据 ， 

$HADOOP HOME/bin/hadoop jar /usr/lib/cdh/hbase/hbase-0.94.15-hdh4.6.0.jar importtsv 
-Dimporttsv.bulk.output-/user/hac/output/2-1 -Dimporttsv.columns- 
HBASE ROW KEY,info:name,info:age,info:phone student /user/hac/input/2-1 

完成 bulk load A 

SHADOOP HOME/bin/hadoop jar /usr/lib/cdh/hbase/hbase-0.94.15-hdh4.6.0.jar completebulkload 
/user/hac/output/2-1 student 


completebulkload 工 具 读 取 生 成 的 文件 ， 判 断 它 们 归属 的 Resgion 
Server 族 群 ， 然 后 访问 适当 的 族群 服务 器 。 族 群 服务 器 会 将 HFile 文 件 
转移 进 自身 存储 目录 中 ， 并 且 为 客户 端 建立 在 线 数据 。 

HBase 说 明文 档 里 面 记 载 ，Bluk Load 方 法 分 为 两 个 主要 步骤 。 

(1) 使 用 HFileOutputFormat 类 通过 一 个 MapReduce 任 务 方式 生成 
HBase 的 数据 文件 ， 就 是 英文 称 为 “StoreFiles” 的 数据 文件 。 由 于 输出 的 
时 候 按照 HBase 内 部 的 存储 格式 来 输出 数据 ， 所 以 后 面 读 入 HBase 集 群 
的 时 候 就 非常 高 效 了 。 为 了 保证 高 效 性 ，HFileOutputFormat 借 助 
configureIncrementalLoad 卫 数 ， 基 于 当前 Table 的 各 Region 边 界 自动 匹配 
MapReduce 的 分 区 类 TotalOrderPartitioner， 这 样 每 一 个 输出 的 HFile 都 会 
是 在 一 个 单独 的 Region 里 面 的 。 

为 了 实现 这 样 的 设计 ， 所 有 任务 的 输出 都 需要 使 用 Hadoop 的 
TotalOrderPartitioner 类 去 对 输出 进行 分 区 ， 按 照 Regions 的 主键 范围 进行 
分 区 。 HFileOutputFormat 类 包含 了 一 个 快捷 方法 ， 即 
configureIncrementalLoad () ， 它 自动 基于 数据 表 的 当前 region 间 隔 生 
成 一 个 TotalOrderPartitionero 

(2) 完成 数据 载 入 到 HBase。 当 所 有 的 数据 都 被 用 
HFileOutputFormat 方 式 准 备 好 以 后 ， 我 们 可 以 使 用 completebulkload 读 
入 到 集群 。 这 个 命令 行 工 具 和 迭代 循环 数据 文件 ， 对 于 每 一 个 数据 文件 
迅速 找到 属于 它 的 region， 然 后 Region 服 务 器 会 读 入 这 些 HFile。 如 果 在 


生成 文件 的 过 程 当 中 region 被 修改 了 ， 那 completebulkload 工 具 会 自动 切 
分 数据 文件 到 新 的 区 域 ， 这 个 过 程 需要 花费 一 些 时 间 。 如 果 数 据 表 
(此 处 是 mytable) 不 存在 ， 工 具 会 自动 创建 该 数据 表 。 
我 们 也 可 以 通过 自己 编写 Bluk Load 代 码 来 完成 数据 导入 工作 。 代 
码 如 代码 清单 4-63 所 示 。 


代码 清单 4-63 MapReduce 方式 导入 HFile 到 HBase 数据 表 
import org.apache.hadoop.conf.Configuration; 
import org.apache.hadoop.fs.Path; 

import org.apache.hadoop.hbase.HBaseConfiguration; 


import org.apache.hadoop.hbase.client.HTable; 


import org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles; 
public class loadIncrementalHFileToHBase { 


public static void main(String[] args) throws Exception { 
Configuration conf - HBaseConfiguration.create(); 
HBaseHelper helper - HBaseHelper.getHelper (conf); 
helper.dropTable ("testtable2"); 
helper.createTable ("testtable2", "colfaml"); 
HTable table = new HTable("testtable2"); 
LoadIncrementalHFiles loader = new LoadIncrementalHFiles (conf); 
loader.doBulkLoad(new Path(args[0]), table); 


} 


我 们 需要 特别 提醒 以 下 两 点 : 
(1) 一 定 要 记得 建 HBase 数 据 表 时 ， 针 对 Region 进 行 的 预 切 分 ， 
这 点 非常 重要 。HFileOutputFormat.configureIncrementalLoad 方 法 会 根据 
Region BY 3X EŒ RA E Reduce HY 2X E LAR & Reduce % m HY RowKey3& 
， 否 则 单个 Reduce 过 大 ， 容 易 造成 任务 处 理 不 均衡 。 造 成 这 个 的 原 
因 是 ， 创 建 HBase 表 的 时 候 ， 默 认 只 有 一 个 Region ， 只 有 等 到 这 个 


Region 的 大 小 超过 一 定 的 阅 值 之 后 ， 才 会 进行 split， 所 以 为 了 利用 完全 
分 布 式 加 快 生 成 HFile 和 导入 HBase 中 以 及 数据 负载 均衡 ， 我 们 需要 在 
创建 表 的 时 候 预 先进 行 分 区 ， 而 进行 分 区 时 要 利用 startKey 与 endKey 进 
行 rowKey 区 间 划 分 (因为 导入 HBase 中 ， 需 要 rowKey 整 体 有 序 ) 。 解 
决 方法 是 在 数据 导入 之 前 ， 自 己 先 写 一 个 MapReduce 的 Job 求 最 小 与 最 
大 的 rowKey， 即 startKey 与 endKey。 

(2) 单个 RowKey 下 的 子 列 不 要 过 多 ， 否 则 在 reduce 阶 段 排序 的 时 
候 会 造成 内 存 溢出 异常 ， 有 一 种 办 法 是 通过 二 次 排序 来 避免 reduce 阶 段 
的 排序 ， 这 个 解决 方案 需要 视 具 体 应 用 而 定 。 

Sqoop 是 Apache 顶 级 项 目 ， 主 要 用 于 在 Hadoop (Hive) 与 传统 的 数 
据 库 (mysql. postgresql) 之 间 进 行 数据 的 传递 ， 可 以 将 一 个 关系 型 
数据 库 ， 例 如 MySQL、 Oracle、Postgres 等 中 的 数据 导入 到 Hadoop 的 
HDFS 中 ， 也 可 以 将 HDFS 的 数据 导 进 到 关系 型 数据 库 中 。Sqoop 支 持 多 
种 导入 方式 ， 包 括 指定 列 导 入 、 指 定格 式 导 入 、 支 持 增 量 导 入 (有 更 
新 才 导 入 ) 等 。Sqoop 的 一 个 特点 就 是 可 以 通过 Hadoop 的 MapReduce 把 
数据 从 关系 型 数据 库 中 导入 数据 到 HDFS。 

Sqoop 的 架构 较为 简单 ， 通 过 整合 Hive， 实 现 SQL 方式 的 操作 ， 
通过 整合 HBase， 可 以 向 HBase 写 入 数据 ， 通 过 整合 Oozie， 拥 有 了 任 
务 流 的 概念 。 而 Sqoop 本 身 是 通过 MapReduce 机 制 来 保证 传输 数据 ， 从 
而 提供 并 发 特性 和 容错 机 制 ， 系 统 架 构图 [8] 如 图 4-9 所 示 。 
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图 4-9 Sqoop 系 统 架 构图 
我 们 这 次 做 的 实验 使 用 了 Sqoop 的 import 功 能 ， 用 于 将 Oracle 中 的 
人 员 信息 导入 到 HBase。 在 Hadoop 和 HBase 正 常 运行 的 环境 里 ， 我 们 首 
先 需要 配置 好 Sqoop ， 然 后 调用 如 下 的 命令 即 可 将 Oracle 中 的 表 导 入 到 
HBase 中 ， 代 码 如 代码 清单 4-64 所 示 。 


代码 清单 4-64 Sqoop 导入 Oracle 数据 到 HBase 
sqoop import 
--connect jdbc:oracle:thin:8172.7.27.225:1521:testzmy //JDBC URL 
--username SYSTEM //Oracle username (必须 大 号 ) 
--password hik123456 //Oracle password 
--query 'SELECT RYID, HZCZRK JBXXB.ZPID, HZCZRK JBXXB.GMSFHM, HZCZRK JBXXB.XM, 
HAZCZRK JBXXB.XB, HZCZRK JBXXB.CSRQ, HZCZRK ZPXXB.2P AS ZP FROM HZCZRK JBXXB JOIN 


HZCZRK_ZPXXB USING(RYID) WHERE SCONDITIONS' 
// Oracle 数据 ，Sqoop 支持 多 表 query 


--split-by RYID / /指定 并 行 处 理 切 分 任务 的 列 名 ， 通 常 为 主键 
--map-column-java ZP-String //2P A LONG RAW 8, sqoop 不 支持 ,需要 映射 成 String 

--hbase-table TESTHZ //HBase 中 的 Table 

--column-family INFO //HBase 中 的 column-family 


代码 清单 4-64 所 示 从 两 张 数据 表 了 HZCZRKJBXXB 和 
HZCZRK_ZPXXB 读 取 数 据 并 写 入 到 HBase 数 据 表 TESTHZ ， 该 数据 表 
有 一 个 列 组 INFO。 我 们 在 VMWare CentOS5.6 单 节点 伪 分 布 式 环境 下 进 
行 了 测试 。 测 试 结果 显示 ， 单 表 HZCZRK_ZPXXB 导 入 90962 条 数据 耗 
时 约 27 分 钟 ， 两 表 HZCZRK_JBXXB 和 HZCZRK_ZPXXB JOIN 导入 
90962 条 数据 耗 时 约 50 分 钟 。 

该 实验 显示 Sqoop 使 用 过 程 中 的 局 限 性 : 

(1) Import 中 进行 多 表 query 的 方式 效率 会 受到 影响 。 

(2) 不 支持 从 数据 库 的 视图 导出 数据 。 

(3) 不 支持 BLOB、RAW 等 大 数据 块 类 型 直接 导入 到 HBase， 需 
要 通过 -map-column-java 将 对 应 的 列 映射 到 java 的 基本 类 型 String 来 处 
理 。 

(4) 每 次 import 只 能 导入 到 HBase 的 一 个 column family。 

总 的 来 说 ，Sqoop 类 似 于 其 他 ETL 工 具 ， 使 用 元 数据 模型 来 判断 数 
据 类 型 ， 并 在 数据 从 数据 源 转移 到 Hadoop 时 确保 类 型 安全 的 数据 处 
理 。Sqoop 专 为 大 数据 批量 传输 设计 ， 能 够 分 割 数据 集 并 创建 Hadoop 任 
务 来 处 理 每 个 区 块 。 


4.4.3 解决 海量 数据 缓存 


大 规模 、 大 数据 量 、 高 并 发 企业 级 或 者 互联 网 应 用 为 了 解决 数据 
缓存 、 降 低 数 据 库 负 载 、 提 高 查询 性 能 等 突出 问题 ， 很 多 采用 了 
Hazelcast、 Oracle Coherence、 GemFire (比如 12306 网 站 ) ， 或 者 目前 
应 用 越 来 越 广泛 的 Redis 等 缓存 技术 、Apache Ignite 内 人 存 数组 组 织 框架 
等 各 种 技术 。 


Hazelcast 

Hazelcast 是 一 个 高 度 可 扩展 的 数据 分 发 和 集群 平台 。 特 性 包括 : 

m 提供 java.util.{Queue，Set，List，Map} 分 布 式 实现 ，; 

m 提供 java.util.concurrency.locks.Lock 分 布 式 实现 ; 

m 提供 java.util.concurrent.ExecutorService 分 布 式 实现 ; 

u 提供 用 于 一 对 多 关系 的 分 布 式 MultiMap ; 

n 提供 用 于 发 布 /订阅 的 分 布 式 Topic (主题 ) ; 

m 通过 JCA 与 J2EE 容 器 集成 和 事务 支持 ; 

m 提供 用 于 安全 集群 的 Socket 层 加 密 ; 

a 支持 同步 和 异步 持久 化 ; 

m 为 Hibernate 提 供 二 级 缓存 Provider ; 

m 通过 JMX 监 控 和 管理 集群 ; 

m 支持 动态 HTTP Session 集 群 ; 

m 利用 备份 实现 动态 分 割 |，; 

a 支持 动态 故障 恢复 。 

Oracle Coherence 

Coherence 是 Oracle 为 了 建立 一 种 高 可 靠 和 高 扩展 集群 计算 的 一 个 
关键 部 件 ， 集 群 措 的 是 多 于 一 个 应 用 服务 器 参与 到 运算 里 。Coherence 
的 主要 用 途 是 共享 一 个 应 用 的 对 象 (主要 是 Java 对 象 ， 比 如 Web 应 用 的 
一 个 会 话 Java 对 象 ) 和 数据 (比如 数据 库 数 据 ， 通 过 OR-MAPPING 后 
成 为 Java 对 象 ) 。 简 单 来 说 ， 就 是 当 一 个 应 用 把 它 的 对 象 或 数据 托管 给 
Coherence 管 理 的 时 候 ， 该 对 象 或 数据 就 能 够 在 整个 集群 环境 (多 个 应 
用 服务 器 节点 ) 共享 ， 应 用 程序 可 以 非常 简单 地 调用 get 方 法 取得 该 对 
象 ， 并 且 由 于 Coherence 本 身 的 元 余 机 制 使 得 任何 一 个 应 用 服务 器 节点 
的 失败 都 不 会 影响 到 该 对 象 的 丢失 。 其 实 如 果 不 使 用 Coherence， 对 于 
一 个 会 话 在 多 个 应 用 服务 器 节点 的 共享 一 般 是 通过 应 用 服务 器 本 身 的 
集群 技术 ， 而 Coherence 的 创造 者 则 认为 基于 某 种 应 用 服务 器 技术 的 集 
群 技术 来 共享 会 话 变量 的 技术 并 不 完整 ， 而 专门 开发 出 Coherence 这 个 
产品 (原来 称 为 tangosol) 并 且 最 后 被 Oracle 收 购 ， 这 个 产品 既 有 原来 


各 种 应 用 服务 器 集群 所 具有 的 各 种 技术 特点 ， 而 且 又 增加 了 原来 各 种 
应 用 服务 器 集群 技术 所 没有 的 各 种 特性 。 

一 般 而 言 ， 整 个 应 用 架构 的 扩展 性 由 架构 里 的 最 不 能 扩展 的 部 位 
( 称 之 为 瓶颈 ) 决定 ， 这 个 瓶颈 一 般 而 言 都 是 数据 源 的 处 理 ， 
Coherence 针 对 这 种 理解 提供 了 应 用 层 的 数据 共享 缓冲 ， 任 何 一 个 时 候 
如 果 应 用 能 够 从 这 个 数据 缓冲 里 满足 要 求 ， 则 不 会 将 请 求 发 给 数据 
源 ， 从 而 极 大 地 增强 一 般 的 瓶颈 (数据 ) 的 扩展 性 。 

为 了 加 强 数 据 的 写 处 理性 能 ，Coherence 还 设计 了 延迟 写 的 功能 ， 
就 是 应 用 的 写 会 先 缓存 在 Coherence 的 缓冲 区 ， 然 后 延迟 写 到 数据 库 
里 ， 为 了 减轻 数据 源 的 写 压 力 ，Coherence 只 把 最 近 的 更 改写 到 数据 
源 ， 比 如 一 条 数据 被 更 改 了 多 遍 ， 则 只 有 最 后 的 更 改 会 被 提交 到 数据 
源 。 而 且 ， 如 果 可 能 ， 多 个 SQL 语句 会 被 变 成 一 个 SQL 语句 批 ， 一 次 提 
交 给 数据 产 ， 这 样 又 极 大 地 降低 了 对 数据 源 的 压力 。 

Coherence 的 第 二 个 非常 重要 的 特地 是 支持 数据 的 分 区 处 理 ， 就 是 
如 果 有 NN 个 处 理 节点 ， 则 每 个 节点 只 管理 1/N 的 数据 ， 当 一 个 节点 失效 
时 ， 该 节点 的 数据 会 在 剩 下 的 节点 均 分 ， 每 个 节点 将 管理 1 (N-1) 的 
数据 。 同 样 的 ， 当 一 个 节点 增加 进来 时 ， 则 每 一 个 节点 都 会 分 配 一 部 
分 数据 给 新 的 节点 ， 则 最 终 每 个 节点 只 管理 1/ (N+1) 的 数据 。 大 家 知 
道 ， 一 般 应 用 服务 器 的 集群 都 有 只 能 缓冲 共享 2G Java 对 象 的 缺点 ， 而 
Coherence 这 种 设计 让 Coherence 能 够 处 理 非 常 多 的 数据 ， 只 需要 通过 增 
加 节点 的 数量 ， 就 可 以 处 理 更 多 的 数据 。 

如 果 安 装 了 Coherence， 则 应 用 服务 器 不 需要 配置 专 有 的 服务 器 集 
群 技术 ， 因 为 Coherence*web 模 块 提 供 了 可 用 于 处 理 HTTP 会 话 信 息 在 
Coherence 集 群 内 共享 的 功能 ， 当 一 个 节点 需要 读 取 HTTP 会 话 信息 而 发 
现 自己 没有 该 会 话 信息 的 时 候 ， 它 会 把 请 求 同 时 发 给 所 有 的 节点 
(multicast) ， 而 当 一 个 节点 需要 写 HTTP 会 话 信息 的 同时 ， 它 也 会 把 
写 请 求 发 给 所 有 的 节点 ， 所 以 2 个 节点 的 处 理 和 100 个 节点 的 处 理 都 是 
一 样 的 。 

GemFire 

GemFire 是 一 个 位 于 应 用 集群 和 后 端 数据 源 之 间 的 高 性 能 、 分 布 式 
的 操作 数据 (operational data) 管理 基础 架构 。 它 提供 了 低 延 迟 、 高 吞 


吐 量 的 数据 共享 和 事件 分 发 。GemFire 充 分 利用 网 络 中 的 内 存 和 磁盘 资 
源 ， 形 成 一 个 实时 的 数据 网 格 (data fabric or grid) 。 

在 P2P 分 布 式 系统 中 ， 应 用 程序 使 用 GemFire 的 镜像 (mirroring) 
功能 来 将 大 量 数据 跨 结 点 分 区 (sharding) 以 及 在 这 些 结 点 间 进 行 数据 
复制 同步 。 因 为 在 P2P 拓 扑 中 缓存 数据 与 应 用 在 一 起 ， 所 以 首先 说 一 下 
RARE FB NIUETR (embedded cache) 其 实 就 是 说 缓存 和 应 
用 程序 在 一 起 ， 直 接 利用 应 用 服务 器 的 内 存 空间 。 也 就 是 我 们 常 说 的 
类 似 Ehcache 的 那 种 本 地 缓存 (local cache) 。 

Mirrored 结 点 就 像 一 块 磁铁 一 样 ， 将 其 他 数据 区 域 的 数据 都 吸附 过 
来 ， 形 成 一 块 完整 的 数据 集合 。 当 一 块 数据 区 域 被 配置 为 mirrored 的 结 
点 第 一 次 新 建 或 重建 时 ，GemFire 将 自动 执行 初始 镜像 抓 取 (initial 
image fetch) 操作 ， 从 其 他 结 点 的 数据 子 集中 还 原 出 完整 的 状态 。 如 果 
此 时 网 络 中 存在 另 一 个 mirrored 结 点 ， 那 么 将 会 执行 最 优 直 接 抓 取 

(optimal directed fetch) 。 

不 同 于 mirrored 结 点 ， 每 个 partitioned 结 点 都 持 有 唯一 的 一 块 数据 。 
应 用 程序 就 像 操 作 本 地 数据 一 样 ，GemFire 在 幕后 管理 各 个 分 区 的 数 
据 ， 并 且 保 证 在 至 多 一 跳 内 (at most one network hop) 完成 数据 访 
问 。 根 据 GemFire 的 哈 希 算法 ， 分 区 数据 会 被 自动 放 入 到 各 个 结 点 的 
bucket 中 。 同 时 GemFire 也 会 自动 分 配 出 见 余 数据 的 位 置 并 进行 复制 。 
当 某 个 结 点 出 错时 ， 客 户 端 请 求 会 自动 被 重 定 向 到 备份 结 点 。 并 且 
GemFire 会 重新 复制 出 一 份 数据 ， 从 而 保证 数据 的 元 余 拷贝 数 。 最 后 ， 
我 们 可 以 随时 向 网 络 中 加 入 新 的 结 点 来 对 GemFire 集 群 进行 动态 扩容 。 

默认 GemFire 使 用 IP 多 播 来 发 现 新 成 员 ， 然 而 所 有 成 员 间 的 通信 都 
采用 TCP。 对 于 部 署 环境 禁止 使 用 IP 多 播 或 者 网 络 跨越 多 个 子 网 时 ， 
GemFire 提 供 备用 方法 : 使 用 轻 量 级 的 定位 服务 器 (locator server) 来 
追踪 所 有 成 员 的 连接 。 新 成 员 加 入 集群 时 ， 将 询问 定位 服务 并 建立 类 
似 于 IP 多 播 的 socket 到 socket 的 TCP 连 接 。 

12306 采 用 的 是 GemFire， 根 据 他 们 发 表 的 文章 ， 我 们 可 以 知道 根 
据 系统 运行 数据 记录 ， 技 术 改 造 之 后 ， 在 只 采用 10 几 台 X86 服 务 器 实现 
了 以 前 数 十 台 小 型 机 的 余 票 计算 和 查询 能 力 ， 单 次 查询 的 最 长 时 间 从 
之 前 的 15 秒 左右 下 降 到 0.2 秒 以 下 ， 缩 短 了 75 们 以 上 。2012 年 春运 的 极 
端 高 流量 并 发 情况 下 ， 支 持 每 秒 上 万 次 的 并 发 查询 ， 高 峰 期 间 达 到 2.6 


万 QPS 吞 吐 量 ， 整 个 系统 效率 显著 提高 。 订 单 查询 系统 改造 ， 在 改造 之 
前 的 系统 运行 模式 下 ， 每 秒 只 能 支持 300-400 个 QPS 的 吞吐 量 ， 高 流量 
的 并 发 查询 只 能 通过 分 库 来 实现 。 改 造 之 后 ， 可 以 实现 高 达 上 万 个 QPS 
的 吞吐 量 ， 而 且 查 询 速 度 可 以 保障 在 20 毫 秒 左 右 。 新 的 技术 架构 可 以 
按 需 弹性 动态 扩展 ， 并 发 量 增加 时 ， 还 可 以 通过 动态 增加 X86 服 务 器 来 
应 对 ， 保 持 毫 秒 级 的 响应 时 间 ]。 

Redis 

Redis 是 一 个 开源 的 使 用 ANSI C 语 言 编 写 、 支 持 网 络 、 可 基于 内 存 
亦 可 持久 化 的 日 志 型 、Key-Value 数 据 库 ， 并 提供 多 种 语言 的 API。 

Redis 是 一 个 key-value 存 储 系 统 。 和 Memcached 类 似 ， 它 支持 存储 
的 value 类 型 相对 更 多 ， 包 括 string (FE) . list (HER) 、set ( 集 
£) 、zset (sorted set 一 有 序 集合 ) 和 hash 〈 哈 希 类 型 ) 。 这 些 数 据 类 
型 都 支持 push/pop、add/remove 及 取 交 集 并 集 和 差 集 及 更 丰富 的 操作 ， 
而 且 这 些 操作 都 是 原子 性 的 。 在 此 基础 上 ，Redis 支 持 各 种 不 同方 式 的 
排序 。 与 Memcached 一 样 ， 为 了 保证 效率 ， 数 据 都 是 缓存 在 内 存 中 。 
区 别 的 是 Redis 会 周期 性 的 把 更 新 的 数据 写 入 磁盘 或 者 把 修改 操作 写 入 
追加 的 记录 文件 ， 并 且 在 此 基础 上 实现 了 master-slave ( 主 从 ) 同步 。 

在 Redis 中 ， 并 不 是 所 有 的 数据 都 一 直 存 储 在 内 存 中 的 。 这 是 和 
Memcached 相 比 一 个 最 大 的 区 别 。Redis 只 会 缓存 所 有 的 key 的 信息 ， 如 
果 Redis 发 现 内 存 的 使 用 量 超过 了 某 一 个 疯 值 ， 将 触发 swap 的 操作 ， 
Redist #5 “swappability=age*log (size in memory) ”计算 出 哪些 key 对 
应 的 value 需 要 swap 到 磁盘 。 然 后 再 将 这 些 key 对 应 的 value 持 久 化 到 磁盘 
中 ， 同 时 在 内 存 中 清除 。 这 种 特性 使 得 Redis 可 以 保持 超过 其 机 器 本 身 
内 存 大 小 的 数据 。 当 然 ， 机 器 本 身 的 内 存 必 须要 能 够 保持 所 有 的 key， 
毕竟 这 些 数 据 是 不 会 进行 swap 操 作 的 。 同 时 由 于 Redis 将 内 存 中 的 数据 
swap 到 磁盘 中 的 时 候 ， 提 供 服 务 的 主线 程 和 进行 swap 操 作 的 子 线程 会 
共享 这 部 分 内 存 ， 所 以 如 果 更 新 需要 swap 的 数据 ，Redis 将 阻塞 这 个 操 
作 ， 直 到 子 线程 完成 swap 操 作 后 才 可 以 进行 修改 。 

ApacheIgnite 内 存 数组 组 织 框架 

Apache Ignite 是 一 个 高 性 能 、 集 成 和 分 布 式 的 内 存 计算 和 事务 平 
台 ， 用 于 大 规模 的 数据 集 处 理 ， 比 传统 的 基于 磁盘 或 内 存 的 技术 具有 
更 高 的 性 能 ， 同 时 他 还 为 应 用 和 不 同 的 数据 源 之 间 提 供 高 性 能 、 分 布 


式 内 存 中 数据 组 织 管理 的 功能 。 我 们 需要 理解 ， 将 数据 存储 在 缓存 中 
能 够 显著 地 提高 应 用 的 速度 ， 因 为 缓存 能 够 降低 数据 在 应 用 和 数据 库 
中 的 传输 频率 。Ignite 来 源 于 尼 基 塔 : 伊 万 诸 夫 于 2007 年 创建 的 GridGain 
系统 公司 开发 的 GridGain 软 件 ， 尼 基 塔 领导 公司 开发 了 领先 的 分 布 式 内 
存 片 内 数据 处 理 技术 领先 的 Java 内 存 片 内 计算 平台 ， 今 天 在 全 世界 每 10 
秒 它 就 会 启动 运行 一 次 。 

Ignite 和 Hadoop 解 决 的 是 不 同 的 问题 ， 即 使 在 一 定 程度 上 可 能 应 用 
了 类 似 的 底层 基础 技术 。Ignite 是 一 种 多 用 途 ， 和 OLAP/OLIP 内 人 存 中 数 
据 结构 相关 的 ， 而 Hadoop 仅 仅 是 Ignite 原 生 支 持 (和 加 速 ) 的 诸多 数据 
来 源 之 一 。 Spark 是 一 个 和 Ignite 类 似 的 项 目 。 但 是 Spark 聚 焦 于 OLAP， 
而 Ignite 和 凭借 强大 的 事务 处 理 能 力 在 混合 型 的 OLTP/OLAP 场 景 中 表现 更 
好 。 特 别 是 针对 Hadoop，Ignite 将 为 现 有 的 Map/Reduce，Pig 或 Hive 作 业 
提供 即 插 即 用 式 的 加 速 ， 避 免 了 推倒 重 来 的 做 法 ， 而 Spark 需 要 先 做 数 
据 ETL ， 更 适合 新 写 的 分 析 应 用 。 

Apache Ignite 人 允许 用 户 将 常用 的 热 数 据 储存 在 内 存 中 ， 它 支持 分 片 
和 复制 两 种 方式 ， 让 开发 者 可 以 均匀 地 将 数据 分 布 式 到 整个 集群 的 主 
机 上 。 同 时 ，Ignite 还 支撑 任何 底层 存储 平台 ， 不 管 是 RDBMS、 
NoSQL， 又 或 是 HDFS。 人 在 集群 配置 好 之 后 ， 数 据 集 增加 只 需 在 Ignite 
集群 中 增加 节点 而 不 需要 重启 整个 集群 。 节 点 数目 可 以 无 限 增加 ， 所 
以 Ignite 的 扩展 性 是 无 穷 的 。 

在 Ignite 的 配置 上 有 下 面 这 几 个 选项 可 供 选 择 : 

m 企 Write-Through 模 式 中 ， 缓 存 中 的 数据 更 新 会 被 同步 更 新 到 数据 
库 中 。Read-Through 模 式 则 是 指 请 求 的 数据 在 缓存 中 不 可 用 时 ， 会 自动 
从 数据 库 中 拉 取 。 

m Ignite 还 提供 了 一 种 叫 作 Write-BehindCaching 的 数据 库 异 步 更 新 
模式 。 默 认 情 况 下 ，Write-Through 中 每 一 次 更 新 都 会 对 数据 库 发 起 一 
次 请 求 。 如 果 使 用 Write-BehindCaching 后 写 ， 对 缓存 的 更 新 会 整合 
批 次 然后 再 发 送 给 数据 库 。 这 对 改 删 频繁 的 应 用 来 说 可 以 达到 相当 的 
性 能 提升 。 

Ignite 提 供 了 易 用 的 schema 映 射 工 具 ， 从 而 系统 可 以 自动 地 与 数据 
库 整 合 。 这 一 工具 可 以 自动 地 连接 数据 库 ， 并 生成 所 有 需要 的 
XMLOR-mapping 配 置 以 及 Java 域 模型 POJOs。 


查询 Ignite 缓 存 很 简单 ， 使 用 的 就 是 标准 的 SQL。Ignite 支 持 所 有 的 
SQL 遂 数 、 聚 合 和 group 操 作 ， 甚 至 支持 分 布 式 SQLJOINs。 下 面 Ignite 
中 一 个 SQL 查询 示例 。 


代码 清单 4-65 Ignite SQL 查询 示例 
IgniteCache«Long, Person? cache = ignite.cache("mycache") ; 
// ‘Select’ query to concatenate the first and last name of all persons. 
SglFieldsQuery sql = new SqlFieldsQuery ( 
"select concat(firstName, ' ', lastName) from Person"); 
// Execute the query on Ignite cache and print the result. 
try (QueryCursor<List<?>> cursor = cache.query(sql)) { 
for (List<?> row : cursor) 
System.out.println("Full name: " + row.get(0)); 
} 
Ignite 上 也 支持 Java8 的 Lambda 方 法 的 使 用 。 在 Ignite 的 分 布 式 网 格 


中 ， 创 建 GridImnstance 实 例 ，grid 通 过 Broadcast (7 $8) 的 方式 来 执行 
GridRunnable 方 法 中 的 操作 ， 如 代码 清单 4-66 所 示 。 


代码 清单 4-66 Ignite 网 格 编程 
try (Gridgrid-GridGain.start () { 
grid.compute () .broadcast ( (GridRunnable) () -> 
System.out.println("HelloWorld")).get(); 


} 
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名 查询 内 存 中 的 数据 ， 并 且 能 够 扩展 SQL 到 时 空 查 询 。 例 如 ， 下 面 的 
代码 中 的 查询 将 找到 地 图 中 的 特定 平方 区 域内 所 有 的 点 。 


代码 清单 4-67 Lambda 方式 返回 所 有 的 点 
Polygonsquare=factory.createPolygon (newCoordinate[] { 
newCoordinate (0,0), 
newCoordinate (0,100), 
newCoordinate (100,100), 


newCoordinate (100,0), 


newCoordinate (0, 0) 
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cache.queries(). 

createSqlQuery (MapPoint.class, "select*fromMapPointwherelocation&&?"). 
queryArguments (square). 

execute () .get () ; 


} 


Apache Ignite 是 一 个 聚焦 分 布 式 内 存 计算 的 开源 项 目 ， 它 在 内 存 中 
储存 数据 ， 并 分 布 在 多 个 节点 上 以 提供 快速 数据 访问 。 此 外 ， 可 选 地 
将 数据 同步 到 缓存 层 同 样 是 一 大 优势 。 最 后 ， 可 以 支持 任何 底层 数据 
库存 储 同样 让 Ignite 成 为 数据 库 缓存 的 首选 。 


4.5 其 他 优化 


4.5.1 Web 系 统 性 能 优化 建议 


在 最 近 若 干 征 里， 由 于 互联 网 行业 的 流行 ，Web 应 用 已 经 变 得 异常 
复杂 。Web 应 用 不 断 地 被 添加 复杂 的 特性 ， 每 天 还 要 处 理 几 百 万 甚至 上 
千 万 的 请 求 。 为 了 达到 最 理想 的 性 能 ， 构 建 适当 的 应 用 架构 并 对 它 的 
运行 容器 进行 调 优 就 显得 非常 重要 。 

多 个 因素 都 会 影响 Web 站 点 的 性 能 ， 包 括 服务 器 分 发 页 面 的 时 间 、 
网 络 延迟 以 及 浏览 器 显示 页 面 的 时 间 。 一 般 来 说 ， 糟 糕 的 页 面 设计 会 
延长 页 面 的 显示 时 间 最 终 导致 用 户 的 不 满 。 所 以 ， 生 成 高 效 的 Web 页 
面 ， 是 web 应 用 设计 中 最 重要 的 步骤 之 一 。 


Web 应 用 的 基准 测试 有 几 个 方面 。 

(1) 对 于 页 面 访问 模式 复杂 的 应 用 ， 可 以 基于 马尔 科 夫 链 制 定 基 
准 测试 。 对 于 各 页 面 访 问 彼此 无 关 的 应 用 ， 可 依据 每 个 页 面 的 预期 访 
问 量 ， 在 基准 测试 中 设 定 相应 的 访问 比例 ， 以 此 降低 复杂 性 。 

(2) 读 取 日 志文 件 可 以 很 好 地 模拟 生产 环境 负载 情况 。 在 生产 环 
境 中 ，Web 服 务 器 接收 请 求 时 通常 也 会 记录 在 访问 日 志 中 ， 可 以 在 基准 
测试 中 回放 上 日志， 以便 尽 可 能 地 模拟 生产 负载 。 需 要 特别 留意 那些 更 
改 数据 的 请 求 (POST, PUT, DELETE) 。 基 准 测试 需要 某 个 生产 环 
境 的 数据 副本 ， 然 后 在 此 基础 上 回放 数据 更 改 请 求 ， 从 而 保证 生产 数 
据 的 一 致 性 不 会 被 破坏 。 

(3) 如 果 页 面 有 多 个 Ajax 请 求 ， 衡 量 包含 所 有 相关 请 求 的 页 面 整 
体 性 能 就 很 重要 了 。 

(4) 如 果 应 用 的 行为 因 人 而 异 ， 会 使 基准 测试 的 制定 变 得 更 为 轩 
难 。 这 类 应 用 的 例子 是 社交 网 络 ， 它 分 发 的 内 容 与 请 求 用 户 有 关 。 非 
登录 用 户 的 请 求 通常 由 缓存 分 发 。 这 些 请 求 相 当 于 给 缓存 进行 负载 测 
试 。 即 便 是 登录 用 户 ， 不 同 用 户 的 应 用 逻辑 也 有 很 大 差别 。 比 如 ， 对 
于 只 有 少量 朋友 的 用 户 与 有 许多 朋友 的 用 户 ， 应 用 性 能 相差 很 大 。 为 
这 类 应 用 制定 精确 的 基准 测试 模型 很 困难 ， 因 为 请 求 分 发 除了 需要 基 
于 页 面 URL 之 外 ， 还 需要 基于 用 户 。 

4.5.1.1 Servlet 和 JSP 优 化 建议 

1. 使 用 init 方 法 和 ContextListener 

Servlet 和 JSP 的 init 方 法 可 用 来 缓存 静态 数据 和 资产 引用 。Web 容 器 
在 响应 请 求 之 前 ， 会 先 初 始 化 Servlet。 这 个 操作 在 Servlet 的 生命 周期 中 
只 执行 一 次 ， 所 以 init () 可 以 用 来 执行 代价 昂贵 的 一 次 性 操作 ， 包 括 
静态 内 容 的 创建 和 缓存 ， 比 如 在 J2EE1.4 的 应 用 中 ， 读 取 配 置信 息 、 初 
始 化 和 缓存 资源 引用 (包括 JNDI 查 找 DataSource) 。 而 在 JavaEE5 种 ， 
可 以 通过 注入 的 方式 访问 资源 ， 所 以 init () 不 再 需要 用 作 此 目的 。 

与 Servlet 的 init () 类 似 ， 在 JSP 页 面 的 初始 化 过 程 中 ，jspInit () 
方法 只 调用 一 次 。 在 JSP 中 提供 用 户 自 定义 的 jspInit O ， 可 以 生成 一 
次 性 的 操作 。 最 常见 的 用 途 是 创建 和 缓存 静态 数据 。 不 过 ，jspInit () 
并 不 常用 。 


Servlet 的 生命 周期 中 会 调用 ContextListener， 可 以 用 在 应 用 程序 特 
定数 据 的 初始 化 和 清扫 阶段 。 

2. 使 用 恰当 的 JSP include 机 制 

JSP 支 持 两 种 在 页 面 中 包含 资源 内 容 的 方法 。 

include 指 令 方 式 。 < %@include file=”relativeURL”% > 将 被 包含 文 
件 的 文本 添加 到 页 面 中 。 这 个 包含 过 程 是 静态 的 ， 意 味 着 文本 会 在 JSP 
页 面 编译 时 合并 进来 。 如 果 被 包含 的 文件 是 JSP 页 面 ， 它 的 JSP 元 素 会 
被 转换 并 包含 到 这 个 页 面 中 。 这 种 做 法 的 缺点 是 ， 被 包含 文件 的 任何 
改动 都 不 会 反映 到 包含 它 的 页 面 中 ， 即 便 开启 了 动态 重新 加 载 JSP 也 
是 如 此 。 只 有 当 顶 层 页 面 发 生变 化 重新 生成 被 包含 内 容 时 ， 这 些 变 化 
才 可 见 。 

include 标 签 方式 。 < jsp: include page=”relativeURL”/ > 支持 为 页 
面 添加 静态 或 动态 的 资源 。 如 果 是 静态 资源 ， 它 的 内 容 (通过 默认 
Servlet 的 调用 获得 ) 就 会 包含 在 调用 页 面 中 。 如 果 是 动态 资源， 调用 的 
结果 会 包含 在 调用 页 面 中 。 属 性 fush=”true"|”false” 可 用 来 指定 在 包含 
资源 调用 页 面 的 内 容 是 否 需 要 刷新 。 这 个 属性 的 默认 值 为 false。 < 
jsp: param > 语句 可 以 将 一 个 或 多 个 名 / 值 对 作为 参数 传递 给 被 包含 的 
资源 。include 标 签 的 动态 性 可 以 不 依赖 顶层 页 面 的 改动 ， 就 能 使 被 包 
含 页 面 的 改动 可 见 。 

由 于 在 编译 时 ，include 声 明 包 含 引 用 资源 的 内 容 ， 这 个 机 制 可 以 
改善 包含 HTML 和 其 他 静态 内 容 的 性 能 。 另 一 方面 ，include 标 签 应 该 用 
于 这 样 的 场景 ， 即 需要 包含 的 内 容 是 引用 资源 的 动态 响应 。 

注意 ， 如 果 是 静态 引用 资产， 我 们 可 以 使 用 include 指 令 ， 而 包含 
资源 动态 生成 的 响应 ， 可 以 使 用 include 标 签 。 

3. 剔 除 空格 

JSP 页 面 模 板 中 的 空格 ， 无 论 有 没有 意义 ， 都 会 被 保留 。 这 意味 着 
一 些 无 天 基 要 的 字符 ， 即 便 浏 览 器 显示 内 容 时 不 需要 ， 也 仍然 会 被 Web 
容器 处 理 并 传送 。 

JSP 页 面 模板 中 保留 的 空格 ， 会 导致 泻 染 输出 中 有 成 块 的 空格 ， 降 
低 HITML 源 文件 的 可 读 性 。 编 码 并 传递 这 些 无 关 字 符 还 会 产生 性 能 开 
销 。 


剔除 指令 < %@page trimDirectiveWhitespages-"true"96 > 可 以 消除 
多 余 的 字符 。 声 明 需 要 加 到 所 有 需要 剔除 空格 的 页 面 中 。 另 外 ， 一 组 
JSP 的 行为 可 以 通过 web.xml 来 配置 。 
在 某 些 情况 下 ， 你 不 希望 多 余 的 字符 增加 传送 成 本 ， 例 如 在 低 带 
宽 网 络 上 分 发 内 容 ， 服 务 器 应 该 以 最 大 压缩 的 形式 生成 内 容 ， 剥 掉 所 
有 不 必要 的 空格 。 一 种 选择 是 包含 从 输出 中 移 除 额外 空格 的 Servlet 
filter。 添 加 filter 会 在 请 求 处 理 的 过 程 中 增加 额外 处 理 成 本 。 第 二 种 选 
择 是 在 部 署 前 使 用 外 部 工具 压缩 JSP。 如 果 应 用 程序 包括 CSS 和 
JavaScript， 那 么 CSS 和 JavaScript 应 该 尽 可 能 小 ， 可 以 采取 压缩 的 方式 
减少 需要 网 络 传递 的 整个 文件 大 小 。 如 果 Wweb 容 器 可 以 配置 成 发 送 压 缩 
版 CSS 和 JavaScript， 且 浏览 器 支持 压缩 ， 那 么 开启 压缩 就 能 减少 负 葵 
fo 
4. 使 用 JSP : useBean 
jsp: useBean 依 据 指定 的 名 字 和 范围 定位 或 初始 化 某 个 Bean。 这 个 
标签 支持 两 类 初始 化 ，beanName 和 class， 还 包括 具有 多 种 值得 scope 属 
性 。 重 点 是 为 这 些 属性 选择 适当 的 值 ， 从 而 提供 所 需 的 功能 和 最 佳 的 
性 能 。 
定位 和 初始 化 Bean 所 需要 采用 的 步骤 如 下 。 
(1) 尝试 用 你 指定 的 范围 和 名 称 定 为 bean。 
(2) 用 你 指定 的 名 称 定 义 一 个 对 象 引 用 变量 。 
(3) 如 果 找 到 了 Bean， 就 将 指向 它 的 引用 保存 在 上 面 的 变量 中 。 
如 果 你 指定 了 类 型 ， 则 把 该 类 型 赋予 那个 Bean。 
(4) 如 果 没 有 找到 Bean， 依 据 你 指定 的 类 型 初始 化 一 个 实例 ， 将 
该 实例 的 引用 保存 在 新 变量 中 。 如 果 类 名 表示 序列 化 模板 ， 则 用 
java.beans.Beans.instatiate 初 始 化 该 Bean。 
(5) 如 果 jsp: UseBean 已 经 初始 化 Bean， 并 且 它 有 Body 标 签 或 者 
元 素 (TE «jsp: useBean > 和 < /jsp: useBean > 之 间 ) ， 则 执行 body 标 
So 
Bean 的 初始 化 取决 于 是 否 指定 了 class 或 beanName 属 性 。 如 果 指 定 
class=”package.class”， 则 Bean 用 关键 字 new 初 始 化 。 如 果 指 定 
beanName=”{package.class| < %=expression%}”， 则 Bean 从 类 、 序 列 化 


模板 、 类 或 序列 化 模板 的 求 值 表达 式 初 始 化 。 用 beanName 可 以 为 初始 
化 需要 的 Bean 提 供 灵 活性 〈 可 以 载运 行 时 计算 需要 加 载 的 类 ) 。 这 种 
情况 下 ， 类 由 方法 java.beans.Beans.instatiate 初始 化 。 如 果 beanName 指 
定 的 值 代表 类 或 者 序列 化 模板 ， 则 Bean 的 初始 化 包括 Classloader 加 载 资 
产 。 

scope 属 性 是 指 Bean 存 活 的 范围 。 它 的 值 包 括 page、request、 
session 及 application ， 默 认为 page。 你 选择 的 scope 值 会 影响 性 能 。 
application 和 范围，Bean 只 创建 一 次 ， 初 始 化 的 代价 分 摊 到 应 用 的 整个 声 
明 周 期 。 但 是 ，Bean 会 增加 应 用 程序 的 内 存 占 用 。 

使 用 Session 范 围 ， 只 要 会 话 是 活跃 的 ，Bean 会 一 直 维 护 在 内 存 
中 ， 也 会 增加 内 存 占 用 。 万 一 用 户 没有 主动 关闭 会 话 ， 服 务 器 就 得 在 
内 存 中 一 直 维 护 会 话 直到 会 话 超时 。 使 用 request 或 page 范 围 时 ， 页 面 调 
用 时 会 创建 新 对 象 。 在 这 些 模式 里 ， 对 象 的 存活 期 相对 短 ， 垃 圾 收集 
可 以 很 快 。 然 而 ，Bean 初 始 化 的 代价 很 高 ， 会 降低 应 用 的 整体 性 能 。 

5. 表 达 式 语言 

JSP2.0 支 持 表 达 式 语言 (EL) ， 使 得 访问 JavaBean 的 数据 比较 容 
易 。Bean 可 以 用 ${fname} 语 法 访问 ， 这 个 语法 可 以 用 在 接受 表达 式 的 静 
态 文 本 或 任何 自 定 义 或 标准 的 标签 属性 中 。EL 可 以 用 在 JSP 的 Scriptlet 
或 者 JSP 的 表达 式 中 。JSP EL 以 及 JSP 标 准 标签 库 (JSTL) 和 自 定义 标 
签 库 使 得 开发 复杂 JSP 要 比 用 Scriptlet 更 容易 。 

从 开发 人 员 的 角度 来 看 ，EL 是 比 Scriptlet 更 好 的 选择 。 但 是 ， 从 性 
能 角度 看 ，EL 增 加 了 解析 变量 名 为 对 象 和 和 计算 表达 式 的 开销 。 而 
Scriptlet 在 编译 阶段 ， 就 将 必要 的 代码 直接 注入 生成 的 Servlet 中 ， 不 需 
要 变量 查找 和 复杂 的 表达 式 计 算 。 由 于 引入 EL 带 来 的 开销 ，EL JSP 页 
面 的 泻 染 时 间 比 同样 功能 基于 Scriptlet 的 页 面 略 长 。 

性 能 上 的 差别 取决 于 表达 式 的 计算 量 和 生成 输出 所 涉及 的 其 他 工 
作 量 。 例 如 ， 如 果 大 部 分 时 间 花 在 列表 生成 上 ， 泻 染 对 象 列表 所 带 来 
的 性 能 影响 就 会 比较 小 。 从 另 一 方面 来 说 ， 如 果 生 成 列表 的 代价 不 
高 ， 变 量 的 计算 代价 就 会 凸显 出 来 ， 从 而 导致 EL 的 性 能 要 比 Scriptlet 
差 。 

6.HTTP 压 缩 


HTTP 压 缩 有 助 于 减少 文本 数据 从 服务 器 传送 到 客户 端的 大 小 。 如 
果 浏 览 器 支持 压缩 ， 服 务 器 可 以 配置 成 传送 压缩 数据 ， 然 后 在 浏览 
端 解压 。 压 缩 量 各 有 不 同 。Andy King 和 Konstantin Balashov 已 经 表明 
HTML 和 CSS 文 件 通常 可 以 压缩 到 约 20% ，JavaScript 文 件 平 均 压 缩 到 
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运送 中 压缩 是 低 带 宽 与 高 CPU、 内 存 使 用 率 之 间 的 权衡 ， 客 户 端 
和 服务 器 都 是 如 此 。 负 和 荷 越 小 ， 传 送 的 成 本 越 低 ， 从 而 用 户 响 应 时 间 
得 以 改善 。 对 于 通过 慢 速 网 络 连接 的 客户 端 ， 传 输 延 迟 占据 整个 响应 
时 间 的 比例 很 高 ， 因 而 压缩 可 以 改善 这 类 客户 端的 性 能 。 然 后 ， 压 缩 
数据 所 消耗 的 CPU 资源 会 降低 Web 容 器 的 整体 吞吐 量 。 开 局 讨 绾 时 ， 客 
户 端 解压 增加 的 成 本 也 需要 考虑 。 

4.5.1.2 内 容 缓存 

现代 Web 应 用 的 生成 内 容 可 以 分 为 两 大 类 : 针对 浏览 用 户 的 一 般 性 
页 面 和 针对 已 知 用 户 的 定制 页 面 。 随 着 网 站 越 来 越 受 欢 迎 ， 支 持 的 用 
户 也 达到 几 十 万 ， 这 就 需要 为 这 些 用 户 制定 不 同 的 缓存 策略 。 一 种 常 
规 的 性 能 优化 方式 是 缓存 经 常 使 用 的 内 容 ， 具 体 方式 有 如 下 几 类 。 

1. 应 用 程序 实现 的 动态 页 面 缓存 

应 用 程序 把 动态 文件 生成 的 html 文 件 缓存 到 文件 服务 器 ， 以 后 用 户 
请 求 动 态 文 件 ， 直 接 从 文件 服务 器 加 载 对 应 的 静态 缓存 的 html 文 件 返 回 
给 用 户 ， 这 里 面 主 要 节省 了 动态 语言 的 执行 时 间 和 数据 库 访 问 时 间 ]。 
但 是 增加 了 缓存 框架 的 加 载 和 缓存 查找 的 时 间 。 

2. 把 解释 执行 的 开发 语言 编译 成 为 目标 代码 

这 个 主要 把 解释 执行 的 高 级 语言 ， 例 如 java，php 直 接 编译 成 为 平 
台 相 关 的 目标 代码 ， 汇 编 代 码 。 在 java 里 面 ， 比 较 著 名 的 就 是 即时 编译 
器 (JIT) ， 其 他 的 语言 也 要 类 似 的 机 制 。 这 里 主要 节省 了 解释 执行 代 
码 的 时 间 。 但 会 增加 即时 编译 的 时 间 。 

3. 利 用 反 向 代理 服务 器 的 缓存 

利用 类 似 nginx 的 反 向 代理 服务 器 ， 对 请 求 的 岂 对 应 的 输出 进行 缓 
存 。 这 个 缓存 和 应 用 程序 实现 的 动态 页 面 缓存 类 似 ， 只 不 过 用 反 向 代 
理 充 当 了 应 用 程序 的 缓存 实现 。 主 要 节省 了 动态 缓存 执行 时 间 和 数据 
库 访问 时 间 。 


4. 客 户 端 浏览 器 缓存 
客户 端 浏 览 器 缓存 主要 是 通过 在 http 头 部 增加 Last-Modified 等 标识 
[9]， 和 服务 器 进行 协商 ， 是 否 是 采用 客户 的 本 机 缓存 来 实现 。 


4.5.2 死 锁 情况 解决 方案 


Java 语 言 通过 synchronized 天 键 字 来 保证 原子 性 ， 这 是 因为 每 一 个 
Object 都 有 一 个 隐 含 的 锁 ， 这 个 也 称 作 监视 器 对 象 。 在 进入 
synchronized 之 前 自动 获取 此 内 部 锁 ， 而 一 旦 离开 此 方式 ， 无 论 是 完 
或 者 中 断 都 会 自动 释放 锁 。 显 然 这 是 一 个 独占 锁 ， 每 个 锁 请 求 之 间 是 
互 斥 的 。 相 对 于 众多 高 级 锁 (Lock/ReadWriteLockSE) , synchronized 
的 代价 都 比 后 者 要 高 。 但 是 synchronzied 的 语法 比较 简单 ， 而 且 也 比较 
容易 使 用 与 理解 。Lock 一 旦 调用 了 lock O 方法 获取 到 锁 而 未 正确 释 
放 的 话 很 有 可 能 造成 死 锁 ， 所 以 Lock 的 释放 操作 总 是 跟 在 finally 代 码 块 
里 面 ， 这 在 代码 结构 上 也 是 一 次 调整 和 多 余 。Lock 的 实现 已 经 将 硬件 
资源 用 到 了 极致 ， 所 以 未 来 可 优化 的 空间 不 大 ， 除 非 硬件 有 了 更 高 的 
性 能 ， 但 是 synchronized 只 是 规范 的 一 种 实现 ， 这 在 不 同 的 平台 不 同 的 
硬件 还 有 很 高 的 提升 空间 ， 未 来 Java 锁 上 的 优化 也 会 主要 在 这 上 面 。 妖 
然 synchronzied 都 不 可 能 避免 死 锁 [10] 产 生 ， 那 么 死 锁 情 况 会 是 经 常 容 
易 出 现 的 错误 。 

死 锁 问题 是 多 线程 特有 的 问题 ， 它 可 以 被 认为 是 线程 间 切 换 消 耗 
系统 性 能 的 一 种 极端 情况 。 在 死 锁 时 ， 线 程 间 相互 等 待 资源 ， 而 又 不 
释放 自身 的 资源 ， 导 致 无 穷 无 尽 的 等 待 ， 其 结果 是 系统 任务 永远 无 法 
执行 完成 。 死 锁 问 题 是 在 多 线程 开发 中 应 该 坚决 避免 和 杜绝 的 问题 。 

一 般 来 说 ， 要 出 现 死 锁 问题 需要 满足 以 下 条 件 。 

1) 互 斥 条 件 : 一 个 资源 每 次 只 能 被 一 个 线程 使 用 。 

(2) 请 求 与 保持 条 件 : 一 个 进程 因 请 求 资源 而 阻塞 时 ， 对 已 获得 
的 资源 保持 不 放 。 

(3) 不 剥夺 条 件 : 进程 已 获得 的 资源 ， 在 未 使 用 完 之 前 ， 不 能 强 
{TRF 

(4) 循环 等 待 条 件 : 若干 进程 之 间 形 成 一 种 头 尾 相 接 的 循环 等 待 
资产 关系 。 


只 要 破坏 死 锁 4 个 必要 条 件 中 的 任何 一 个 ， 死 锁 问 题 就 能 被 解决 。 

我 们 先 来 看 一 个 示例 ， 前 面 说 过 ， 死 锁 是 两 个 甚至 多 个 线程 被 永 
久 阻塞 时 的 一 种 运行 局 面 ， 这 种 局 面 的 生成 伴随 着 至 少 两 个 线程 和 两 
个 或 多 个 资源 。 代 码 清单 4-65 所 示 的 示例 中 ， 我 们 编写 了 一 个 简单 的 程 
序 ， 它 将 会 引起 死 锁 发 生 ， 然 后 我 们 就 会 明日 如 何 分 析 它 。 


代码 清单 4-65 死 锁 示 例 1 
public class ThreadDeadlock { 
public static void main(String[] args) throws InterruptedException { 
Object objl = new Object () ; 
Object obj2 = new Object (); 
Object 0bj3 = new Object () ; 
Thread tl = new Thread(new SyncThread(objl, obj2), "t1"); 
Thread t2 = new Thread(new SyncThread(obj2, obj3), "t2"); 
Thread t3 = new Thread(new SyncThread(obj3, objl), "t3"); 
tlestart (iy 
Thread. sleep (5000) ; 
t2.start(); 

Thread. sleep (5000) ; 

t3.start (); 


} 


class SyncThread implements Runnable{ 


private Object objl; 

private Object obj2; 

public SyncThread(0bject ol, Object 02) { 
this.objl=ol; 

this.obj2=02; 

} 


@Override 

public void run() { 

String name = Thread.currentThread() .getName () ; 
System.out.println(name + " acquiring lock on "+obj1); 


synchronized (obj1) ( 


+ 


System. out.println (name acquired lock on "40bjl); 


work(); 


System.out.println(name + " acquiring lock on "*obj2); 


synchronized (0bj2) { 


+ 


System. out.println (name acquired lock on "40bj2); 
work () 

} 
System.out.print1n (name 


} 


System.out.println(name + 


+ 


released lock on "40bj2); 


released lock on "40bjl); 


System.out.println(name + " finished execution."); 
} 

private void work() { 

try { 

Thread. sleep (30000) ; 

catch (InterruptedException e) { 


e.printStackTrace(); 


} 


在 上 面 的 程序 中 同步 线程 正 完成 Runnable 的 接口 ， 它 工作 的 是 两 个 
对 象 ， 这 两 个 对 象 向 对 方 寻 求 死 锁 而 且 都 在 使 用 同步 阻塞 。 在 主 函 数 
中 ， 我 使 用 了 三 个 为 同步 线程 运行 的 线程 ， 而 且 在 其 中 每 个 线程 中 都 
有 一 个 可 共享 的 资源 。 这 些 线程 以 向 第 一 个 对 象 获 取 封 锁 这 种 方式 运 
行 。 但 是 当 它 试 着 向 第 二 个 对 象 获取 封锁 时 ， 它 就 会 进入 等 待 状态 ， 
因为 它 已 经 被 另 一 个 线程 封锁 住 了 。 这 样 ， 在 线程 引起 死 锁 的 过 程 


中 ， 就 形成 了 一 个 依赖 于 资源 的 循环 。 当 我 执行 上 面 的 程序 时 ， 就 产 
生 了 输出 ， 但 是 程序 却 因为 死 锁 无 法 停止。 

JVM 提 供 了 一 些 工 具 可 以 来 帮助 诊断 死 锁 的 发 生 ， 如 下 面 程序 清 
单 4-66 所 示 ， 我 们 实现 了 一 个 死 锁 ， 然 后 尝试 通过 jstack 命令 追踪 、 分 
析 死 锁 发 生 。 


代码 清单 4-66 死 锁 代 码 2 
import java.util.concurrent.locks.ReentrantLock; 
// 下 面 演示 一 个 简单 的 死 锁 ， 两 个 线程 分 别 占用 south 锁 和 north 锁 ， 并 同时 请 求 对 方 占用 的 锁 ， 时 至 
IU 
public class DeadLock extends Thread{ 
protected Object myDirect; 
static ReentrantLock south = new ReentrantLock(); 
static ReentrantLock north = new ReentrantLock(); 
public DeadLock(0bject obj) { 
this.myDirect = obj; 
if (myDirect==south) { 


this.setName ("south"); 

}else{ 

this.setName ("north"); 

} 

} 

@Override 

public void run() { 

if (myDirect==south) { 

try{ 

north.lockInterruptibly();//4JA north 
try{ 

Thread.sleep (500); 

)catch (Exception ex) { 
ex.printStackTrace(); 

} 

south.lockInterruptibly(); 
System.out.println("car to south has passed"); 
)catch(InterruptedException ex) { 
System.out.println("car to south is killed"); 
ex.printStackTrace(); 

)finallyí 

if (north.isHeldByCurrentThread() ) { 
north. -unlock Cz 

} 

if (south.isHeldByCurrentThread() ) { 
somrH.unlock). 

) 

} 

} 

if (myDirect==north) { 

try{ 

south.lockiInterruptibly();//4/ south 
try{ 

Thread.sleep (500); 

)catch (Exception ex) { 
ex.printStackTrace(); 

} 

north.lockiInterruptibly(); 
System.out.println("car to north has passed"); 
}catch (InterruptedException ex) { 
System.out.printin("car to north is killed"); 
ex.printStackTrace(); 

}finally{ 

if (north.isHeldByCurrentThread() ) { 
north.unlock(); 

} 

if (south.isHeldByCurrentThread() ) { 
south.unlock(); 


} 


public static void main(String[] args) throws InterruptedException[ 
DeadLock car2south = new Deadlock (south); 

DeadLock car2north = new DeadLock (north); 

car2south.start(); 

car2north.start () ; 

} 

} 


jstack 可 用 于 导出 Java 应 用 程序 的 线程 堆栈 ，-l] 选项 用 于 打印 锁 的 
附加 信息 。 我 们 运行 jstack 命令 ， 输 出 入 清单 4-67 和 4-68 所 示 ， 其 中 代 
码 清单 4-67 里 面 可 以 看 到 线程 处 于 运行 状态 ， 代 码 中 调用 了 拥有 锁 投 
票 、 定 时 锁 等 候 和 可 中 断 锁 等 候 等 特性 的 ReentrantLock 锁 机 制 。 


代码 清单 4-67 jstack 运行 输出 
[root@facenode4 ~]# jstack -1 31274 
2015-01-29 12:40:27 
Full thread dump Java HotSpot(TM) 64-Bit Server VM (20.45-b01 mixed mode): 
"Attach Listener" daemon prio-10 tid=0x00007f6d3c001000 nid= 
0x7a87 waiting on condition [0x0000000000000000] 
java.lang.Thread.State: RUNNABLE 
Locked ownable synchronizers: 
- None 
"DestroyJavaVM" prio-10 tid=0x00007f6da4006800 nid= 
0x7a2b waiting on condition [0x0000000000000000) 
java.lang.Thread.State: RUNNABLE 
Locked ownable synchronizers: 
- None 
"north" prio-10 tid-0x00007f6da4101800 nid- 
0x7a47 waiting on condition [0x00007f6089630000] 
java.lang.Thread.State: WAITING (parking) 
at sun.misc.Unsafe.park(Native Method) 
- parking to wait for <0x000000075903c7c8> ( 
a java.util.concurrent.locks.ReentrantLock$NonfairSync) 
at java.util.concurrent.locks.LockSupport .park (LockSupport . java:156) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
parkAndCheckInterrupt (AbstractQueuedSynchronizer.java:811) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
doAcquireInterruptibly (AbstractQueuedSynchronizer.java:867) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
acquireInterruptibly (AbstractQueuedSynchronizer.java:1201) 
at java.util.concurrent.locks.ReentrantLock.lockInterruptibly (ReentrantLock. 
java:312) 
at DeadLock.run(DeadLock.java:50) 


Locked ownable synchronizers: 


- «0x000000075903c798» (a java.util.concurrent.locks.ReentrantLock$NonfairSync) 
"south" prio-10 tid-0x00007f6da4100000 nid- 
0x7a46 waiting on condition [0x00007f648973c000] 
java.lang.Thread.State: WAITING (parking) 
at sun.misc.Unsafe.park(Native Method) 
- parking to wait for <0x000000075903c798> ( 
a java.util.concurrent.locks.ReentrantLock$NonfairSync) 
at java.util.concurrent.locks.LockSupport.park(LockSupport.java:156) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
parkAndCheckInterrupt (AbstractQueuedSynchronizer.java:811) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
doAcquireInterruptibly(AbstractQueuedSynchronizer.java:867) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
acquireInterruptibly (AbstractQueuedSynchronizer.java:1201) 
at java.util.concurrent.locks.ReentrantLock.lockInterruptibly (ReentrantLock. 
java:312) 
at DeadLock.run(DeadLock.java:28) 
Locked ownable synchronizers: 
- <0x000000075903c7c8> (a java.util.concurrent.locks.ReentrantLock$NonfairSync) 


"Low Memory Detector" daemon prio-10 tid-0x00007f6da40d2800 nid- 
0x7a44 runnable [0x0000000000000000] 

java.lang.Thread.State: RUNNABLE 

Locked ownable synchronizers: 

- None 

"C2 CompilerThreadi" daemon prio-10 tid-0x00007f£6da40d0000 nid= 
0x7a43 waiting on condition [0x0000000000000000] 
java.lang.Thread.State: RUNNABLE 

Locked ownable synchronizers: 

- None 

"C2 CompilerThread0" daemon prio-10 tid-0x00007f6da40cd000 nid- 
0x7a42 waiting on condition [0x0000000000000000] 
java.lang.Thread.State: RUNNABLE 

Locked ownable synchronizers: 

- None 

"Signal Dispatcher" daemon prio-10 tid-0x00007f£6da40cb000 nid- 
Ox7a41 runnable [0x0000000000000000] 

java.lang.Thread.State: RUNNABLE 

Locked ownable synchronizers: 

- None 

"Finalizer" daemon prio-10 tid-0x00007f6da40af000 nid- 

0x7a40 in Object.wait() [0x00007f6d89d44000] 
java.lang.Thread.State: WAITING (on object monitor) 

at java.lang.Object.wait(Native Method) 

- waiting on «0x0000000759001300» (a java.lang.ref.ReferenceQueueSLock) 
at java.lang.ref.ReferenceQueue.remove (ReferenceQueue.java:118) 
- locked «0x0000000759001300» (a java.lang.ref.ReferenceQueueSLock) 
at java.lang.ref.ReferenceQueue.remove (ReferenceQueue.java:134) 


at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:171) 
Locked ownable synchronizers: 

- None 

"Reference Handler" daemon prio-10 tid=0x00007f6da40ad000 nid= 
0x7a3f in Object.wait() [0x00007£6489e45000] 
java.lang.Thread.State: WAITING (on object monitor) 

at java.lang.Object.wait(Native Method) 

- waiting on <0x00000007590011d8> (a java.lang.ref.Reference$Lock) 
at java.lang.Object.wait (Object.java:485) 

at java.lang.ref.Reference$ReferenceHandler.run (Reference. java:116) 
- locked <0x00000007590011d8> (a java.lang.ref.Reference$Lock) 
Locked ownable synchronizers: 

- None 


"VM Thread" prio=10 tid=0x00007f6da40a6000 nid-0x7a3e runnable 

"GC task thread#0 (ParallelGC)" prio-10 tid-0x00007f6da4019800 nid=0x7a2c runnable 
"GC task thread#1 (ParallelGC)" prio-10 tid=0x00007f6da401b000 nid=0x7a2d runnable 
"GC task thread#2 (ParallelGC)" prio=10 tid-0x00007f6da401d000 nid=0x7a2e runnable 
"GC task thread#3 (ParallelGC)" prio=10 tid-0x00007f6da401f000 nid=0x7a2f runnable 
"GC task thread#4 (ParallelGC)" prio=10 tid=0x00007f6da4020800 nid=0x7a30 runnable 
"GC task thread#5 (ParallelGC)" prio-10 tid=0x00007£6da4022800 nid=0x7a31 runnable 
"GC task thread#6 (ParallelGC)" prio=10 tid-0x00007f6da4024800 nid=0x7a32 runnable 
"GC task thread#7 (ParallelGC)" prio-10 tid=0x00007f6da4026000 nid=0x7a33 runnable 
"GC task thread#8 (ParallelGC)" prio=10 tid=0x00007£6da4028000 nid=0x7a34 runnable 
"GC task thread#9 (ParallelGC)" prio-10 tid=0x00007£6da402a000 nid=0x7a35 runnable 
"GC task thread#10 (ParallelGC)" prio-10 tid-0x00007f6da402b800 nid=0x7a36 runnable 
"GC task thread#11 (ParallelGC)" prio=10 tid=0x00007£6da402d800 nid=0x7a37 runnable 
"GC task thread#12 (ParallelGC)" prio-10 tid=0x00007f6da402f800 nid=0x7a38 runnable 
"GC task thread#13 (ParallelGC)" prio=10 tid=0x00007f6da4031000 nid=0x7a39 runnable 
"GC task thread#14 (ParallelGC)" prio=10 tid=0x00007£6da4033000 nid=0x7a3a runnable 
"GC task thread#15 (ParallelGC)" prio=10 tid=0x00007f£6da4035000 nid=0x7a3b runnable 
"GC task thread#16 (ParallelGC)" prio=10 tid-0x00007f6da4036800 nid-0x7a3c runnable 
"GC task thread#17 (ParallelGC)" prio=10 tid-0x00007f6da4038800 nid=0x7a3d runnable 


"VM Periodic Task Thread" prio-10 tid=0x00007f6da40dd000 nid=0x7a45 waiting on 
condition 
JNI global references: 886 


代码 清单 4-68 直 接 打 印 出 出 现 死 锁 的 情况 ， 报 告 north 和 sourth 两 个 
线程 互相 等 待 资源 ， 出 现 了 死 锁 。 


代码 清单 4-68 jstack 运行 输出 片段 


Found one Java-level deadlock: 


"north": 

waiting for ownable synchronizer 0x000000075903c7c8, ( 
a java.util.concurrent.locks.ReentrantLock$NonfairSync) , 
which is held by "south" 


"south": 

waiting for ownable synchronizer 0x000000075903c798, ( 
a java.util.concurrent.locks.ReentrantLock$NonfairSync), 
which is held by "north" 

Java stack information for the threads listed above: 


"north": 

at sun.misc.Unsafe.park(Native Method) 

- parking to wait for <0x000000075903c7c8> ( 

a java.util.concurrent.locks.ReentrantLock$NonfairSync) 

at java.util.concurrent.locks.LockSupport.park(LockSupport.java:156) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
parkAndCheckInterrupt (AbstractQueuedSynchronizer.java:811) 

at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
doAcquireInterruptibly (AbstractQueuedSynchronizer.java:867) 

at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
acquireInterruptibly (AbstractQueuedSynchronizer.java:1201) 

at java.util.concurrent.locks.ReentrantLock.lockInterruptibly (ReentrantLock. 

java:312) 

at DeadLock.run(DeadLock.java:50) 

"south": 

at sun.misc.Unsafe.park(Native Method) 

- parking to wait for <0x000000075903c798> ( 

a java.util.concurrent.locks.ReentrantLock$NonfairSync) 

at java.util.concurrent.locks.LockSupport.park (LockSupport. java:156) 
at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
parkAndCheckInterrupt (AbstractQueuedSynchronizer.java:811) 

at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
doAcquireInterruptibly (AbstractQueuedSynchronizer.java:867) 

at java.util.concurrent.locks.AbstractQueuedSynchronizer. 
acquireInterruptibly (AbstractQueuedSynchronizer.java:1201) 

at java.util.concurrent.locks.ReentrantLock.lockInterruptibly (ReentrantLock. 

java:312) 
at DeadLock. run (DeadLock. java:28) 
Found 1 deadlock. 


死 锁 是 由 四 个 必要 条 件 导 致 的 ， 所 以 一 般 来 说 ， 只 要 破坏 这 四 个 
必要 条 件 中 的 一 个 条 件 ， 死 锁 情况 就 不 会 发 生 。 

(1) 如 果 想 要 打破 互 斥 条 件 ， 我 们 需要 允许 进程 同时 访问 某 些 资 
源 ， 这 种 方法 受制 于 实际 场景 ， 不 太 容 易 实 现 条 件 。 

(2) 打破 不 可 抢占 条 件 ， 这 样 需要 允许 进程 强行 从 占有 者 那里 夺 
A= o 点 理解 ， 占 有 资源 的 进程 不 能 再 申请 占有 其 
他 资源 ， 必 须 释放 手 上 的 资产 之 后 才能 发 起 申请 ， 这 个 其 实 也 很 难 找 
simis. 


(3) 进程 在 运行 前 申请 得 到 所 有 的 资源 ， 否 则 该 进程 不 能 进入 准 
备 执 行 状 态 。 这 个 方法 看 似 有 点 用 处 ， 但 是 它 的 缺点 是 可 能 导致 资源 
利用 率 和 进程 并 发 性 降低 。 


(4) 避免 出 现 资源 申请 环 路 ， 即 对 资源 事先 分 类 编号 ， 按 号 分 
配 。 这 种 方式 可 以 有 效 提 高 资产 的 利用 率 和 系统 吞吐 量 ， 但 同时 增加 
了 系统 开销 ， 增 大 了 进程 对 资源 的 占用 时 间 。 

如 果 我 们 在 死 锁 检查 时 发 现 了 死 锁 情况 ， 那 么 就 要 努力 消除 死 
锁 ， 使 系统 从 死 锁 状态 中 恢复 过 来 。 消 除 死 锁 的 几 种 方式 如 下 。 

(1) 最 简单 、 最 常用 的 方法 就 是 进行 系统 的 重新 启动 ， 不 过 这 种 
方法 代价 很 大 ， 它 意味 着 在 这 之 前 所 有 的 进程 已 经 完成 的 计算 工作 都 
将 付 之 东 流 ， 包 括 参 与 死 锁 的 那些 进程 ， 以 及 未 参与 死 锁 的 进程 。 

(2) 撤销 进程 ， 剥 夺 资 源 。 终 止 参与 死 锁 的 进程 ， 收 回 它 们 占有 
的 资产 ， 从 而 解除 死 锁 。 这 时 又 分 两 种 情况 : 一 次 性 撤销 参与 死 锁 的 
全 部 进程 ， 剥 和 村 全 部 资产 ; 或 者 逐步 撤销 参与 死 锁 的 进程 ， 逐 步 收 回 
死 锁 进程 占有 的 资源 。 一 般 来 说 ， 选 择 逐 步 撤销 的 进程 时 要 按照 一 定 
的 原则 进行 ， 目 的 是 撤销 那些 代价 最 小 的 进程 ， 比 如 按 进程 的 优先 级 
确定 进程 的 代价 ， 考 虑 进程 运行 时 的 代价 和 与 此 进程 相关 的 外 部 作业 
的 代价 等 因素 。 

(3) 进程 回 退 策略 ， 即 让 参与 死 锁 的 进程 回 退 到 没有 发 生死 锁 前 
某 一 点 处 ， 并 由 此 点 处 继续 执行 ， 以 求 再 次 执行 时 不 再 发 生死 锁 。 虽 
然 这 是 个 较 理 想 的 办 法 ， 但 是 操作 起 来 系统 开销 极 大 ， 要 有 堆栈 这 样 
的 机 构 记 录 进 程 的 每 一 步 变 化 ， 以 便 今后 的 回 退 ， 有 时 无 法 做 到 这 


MySQL 和 死 锁 情况 解决 方法 
假设 我 们 用 Show innodb status 检 查 引 擎 状态 时 发 现 了 死 锁 情况 ， 如 
代码 清单 4-69 所 示 。 


代码 清单 4-69 MySQL 死 锁 
WAITING FOR THIS LOCK TO BE GRANTED: 
RECORD LOCKS space id 0 page no 843102 n bits 600 index KEY TSKTASK MONTIME2' of table 
'dcnet db/TSK TASK trx id 0 677833454 lock mode X locks rec but not gap waiting 
Record lock, heap no 395 PHYSICAL RECORD: n fields 3; compact format; info bits 0 
0: len 8; hex 8000000000000425; asc $;; 1: len 8; hex 800012412c66d29c; 
asc A,f ;; 2: len 8; hex 800000000097629c; asc b ;; 
*** WE ROLL BACK TRANSACTION 


我 们 假设 相关 的 数据 表 上 面 有 一 个 索引 ， 这 次 的 死 锁 就 是 由 于 两 
条 记录 同时 访问 到 了 相同 的 索引 造成 的 。 

我 们 首先 来 看 看 InnoDB 类 型 的 数据 表 ， 只 要 能 够 解决 索引 问题 ， 
就 可 以 解决 死 锁 问 题 。MySQL 的 InnoDB 引 擎 是 行 级 锁 ， 需 要 注意 的 
是 ， 这 不 是 对 记录 进行 锁定 ， 而 是 对 索引 进行 锁定 。 在 UPDATE、 
DELETE 操 作 时 ，MySQL 不 仅 锁定 WHERE 条 件 扫描 过 的 所 有 索引 记 
录 ， 而 且 会 锁定 相 邻 的 键 值 ， 即 所 谓 的 next-key locking。 如 语句 
UPDATE TSK TASK SET UPDATE TIME-NOW () WHERE ID > 
10000 会 锁定 所 有 主键 大 于 等 于 1000 的 所 有 记录 ， 在 该 语句 完成 之 前 ， 
你 就 不 能 对 主键 等 于 10000 的 记录 进行 操作 ; 当 非 得 索引 (non-cluster 
index) 记录 被 锁定 时 ， 相 关 的 簇 索引 (cluster index) 记录 也 需要 被 锁 
定 才能 完成 相应 的 操作 。 

再 分 析 一 下 发 生 问 题 的 两 条 SQL 语句 ， 当 “update 
TSK_TASK set STATUS ID-1064, UPDATE TIME-now () where 
STATUS ID-1061 and 


MON. TIME < date sub (now () , INTERVAL 30 minute) ”执行 
Bj, MySQL 会 使 FHKEY. TSKTASK MONTIME2 索引 , 因此 首先 
锁定 相关 的 索引 记录 ， 因 为 KEY_TSKTASK_MONTIME2 是 非 簇 
索引 ， 为 执行 该 语句 ，MySQL 还 会 锁定 簇 索 引 (主键 索引 ) o 


R 设 “update  TSK TASK set STATUS ID-1067 , 
UPDATE TIME-now () where ID in (9921180) ”几乎 同时 执行 时 ， 
本 语句 首先 锁定 族 索 引 (ER) ， 由 于 需要 更 新 STATUS_ID 的 值 ， 所 
以 还 需要 锁定 KEY_TSKTASK_MONTIME2 的 某 些 索引 记录 。 

这 样 第 一 条 语句 锁定 了 KEY_TSKTASK_MONTIME2 的 记录 ， 等 待 
主键 索引 ， 而 第 二 条 语句 则 锁定 了 主键 索引 记录 ， 而 等 待 
KEY_TSKTASK_MONTIME2 的 记录 ， 这 样 死 锁 就 产生 了 。 

我 们 通过 拆 分 第 一 条 语句 解决 了 死 锁 问题 : 即 先 查 出 符合 条 件 的 
ID: select ID from TSK_TASK where STATUS ID=1061 and MON TIME 
< date sub (now () , INTERVAL 30 minute) ; 然后 再 更 新 状态 : 
update TSK_TASK set STATUS ID-1064 where IDin (....) o 


4.5.3 JavaBeans 组 件 


JavaBeans 是 Java 平 台 上 的 组 件 模型 。 要 在 Java 平 台 上 创建 可 复 用 的 
组 件 ， 应 该 遵循 JavaBeans 的 规范 。 对 于 JavaBeans 组 件 ， 开 发 人 员 比 较 
熟悉 的 是 Java EE 中 的 EJB (Enterprise JavaBeans) ， 以 及 Java 类 中 遵循 
JavaBeans 命 名 规范 的 属性 获取 和 设置 的 方法 。JavaBeans 的 强大 之 处 在 
于 以 规范 的 组 件 模型 作为 基础 ， 可 以 通过 工具 很 方便 地 进行 单个 组 件 
的 自 定义 和 多 个 组 件 的 组 装 等 操作 。 对 于 所 有 遵循 JavaBeans 规 范 的 组 
件 ， 都 可 以 通过 工具 以 统一 的 方式 来 进行 操作 。 

符合 JavaBeans 规 荡 的 每 个 组 件 都 包含 3 类 信息 ， 分 别 是 属性 、 方 法 
和 事件 。 属 性 指 的 是 一 个 组 件 暴 露出 来 的 外 观 或 行为 上 的 特征 。 可 以 
通过 改变 数据 的 值 来 定制 组 件 的 外 观 或 行为 。JavaBeans 组 件 的 方法 与 
一 般 的 Java 方 法 并 没有 区 别 ， 可 以 在 其 他 组 件 中 调用 。 事 件 是 组 件 之 间 
进行 交互 的 方式 。 某 个 组 件 可 以 发 布 事件 ， 而 另外 的 组 件 可 以 在 这 个 
事件 上 注册 监听 器 。 

一 个 JavaBeans 组 件 可 以 通过 java.beans.Introspector 类 来 获取 组 件 中 
的 属性 、 方 法 和 事件 的 信息 ， 使 用 的 是 Intrpspector 类 中 的 静态 方法 
getBeanInfo 。 该 方法 的 返回 值 是 包含 了 组 件 相 关 信 息 的 
java.beans.BeanInfo 接 口 的 实现 对 象 。 获 取 组 件 信 息 的 方式 可 以 有 两 
种 ， 一 种 是 开发 人 员 自 己 提供 的 BeanInfo 接 口 的 实现 类 ， 另 外 一 种 是 由 
系统 通过 反射 API 来 自动 发 现 组 件 中 的 信息 。 对 于 第 一 种 方式 ， 系 统 会 


根据 固定 的 名 称 模式 来 查找 组 件 对 应 的 BeanInfo 接 口 的 实现 类 。 比 如 ， 
对 于 类 名 为 “com.java7book.My” 的 组 件 ， 查 找 类 名 为 
“com.java7book.MyBeanInfo” 的 BeanInfo 接 口 的 实现 类 作为 组 件 的 信息 
来 源 。 如 果 没 有 找到 相关 实现 类 ， 会 使 用 第 二 种 方式 ， 即 通过 反射 API 
来 发 现 相关 信息 。 这 两 种 方式 的 一 个 重要 区 别 在 于 ， 在 找到 BeanInfo 接 
口 的 实现 类 之 后 ， 不 会 再 继续 查找 该 组 件 的 父 类 来 获取 信息 ;而 通过 
反射 API 的 方式 则 会 沿 着 继承 层次 结构 树 一 直 向 上 查找 父 类 中 的 相关 信 
Elo 

对 于 具体 的 组 件 信 息 的 获取 过 程 ，getBeanInfo 方 法 也 提供 了 不 同 
的 重 载 方式 供 开 发 人 员 进 行 配置 。 可 以 配置 的 内 容 主 要 有 两 个 ， 一 个 
是 在 获取 过 程 中 包含 哪些 类 中 的 信息 。 前 面 提 到 过 ， 组 件 的 父 类 中 的 
信息 有 可 能 被 包含 进来 ， 如 果 不 希 望 包含 组 件 的 某 些 父 类 中 的 信息 ， 
那么 可 以 指明 终止 组 件 信息 获取 过 程 的 类 名 。 当 沿 着 继承 层次 结构 树 
向 上 获取 时 ， 如 果 遇 到 指定 的 终止 类 ， 就 停止 继续 获取 。 另 外 一 个 可 
配置 的 内 容 是 对 找到 的 BeanInfo 接 口 实现 类 的 处 理 方式 。 在 getBeanInfo 
万 法 中 允许 设置 3 种 不 同 的 处 理 方 式 ， 对 应 的 参数 值 分 别 是 使 用 所 有 
BeanInfo 接 口 实现 类 的 USE_ALL BEANINFO、 忽 略 组 件 类 对 应 的 
BeanInfo 接 口 实现 类 的 IGNORE_IMMEDIDATE BEANINFO 和 忽略 包 
括 组 件 类 的 父 类 在 内 的 所 有 Beanmfo 接口 实现 类 的 
IGNORE, ALL BEANINFOse 

通过 这 两 种 配置 方式 ， 可 以 很 好 地 控制 组 件 信息 的 获取 过 程 。 不 
过 在 Java7 之 前 ， 这 两 种 种 配置 方式 不 能 同时 使 用 ， 只 能 使 用 其 中 一 
种 。Java7 添 加 了 额外 的 getBeanInfo 的 重 载 方式 。 

JavaBeans 组 件 也 提供 了 动态 执行 语句 和 表达 式 的 能 力 ， 主 要 是 为 
了 方便 工具 的 使 用 者 以 类 似 脚 本 语言 的 方式 来 对 组 件 进 行 操 作 ， 比 如 
调用 一 个 组 件 对 象 myBean 的 open 方 法 的 语句 可 以 直接 写成 
*myBean.open () ”。 语 句 和 表达 式 的 区 别 在 于 ， 语 句 不 关心 具体 的 执 
行 结果 ， 而 表达 式 则 会 把 执行 结果 记录 下 来 。 语 句 和 表达 式 分 别 用 
java.beans.Statement 和 java.beans.Expression 类 来 表示 。Expression 类 继承 
组 Statement 类 ， 并 添加 了 获取 和 设置 执行 结果 的 方法 。Statement 类 的 
execture 方 法 用 来 执行 语句 。 在 Java7 种 ，Expression 类 增加 了 缓存 执行 
结果 的 功能 。 当 通过 Expression 类 的 getValue 来 获取 执行 结果 时 ， 如 果 


execute 方 法 之 前 没有 被 调用 过 ， 则 会 先 调 用 execute 方 法 ， 再 返回 结 
果 ， 同 时 也 会 把 执行 结果 记录 下 来 。 
JavaBeans 组 件 在 其 属性 发 生变 化 之 后 ， 可 以 被 持久 化 ， 以 保存 组 
件 的 内 部 状态 。 之 后 再 次 需要 时 可 以 把 保存 的 内 容 再 次 读 取 处 理 ， 并 
恢复 组 件 的 内 部 状态 。JavaBeans 组 件 的 持久 化 依赖 的 是 Java 标 准 的 对 
象 序列 化 机 制 。 一 般 来 说 ， 可 以 把 组 件 的 内 部 状态 以 流 的 二 进 制 形式 
保存 ， 或 者 保存 成 XML 文件 。 以 流 的 形式 进行 持久 化 时 使 用 的 是 Java 
FR BS java.io.ObjectInputStream 和 java.io.ObjectOutputStream 类， 而 在 以 
XML 文件 作为 持久 化 形式 时 ， 使 用 的 是 java.beans.XMLEncoder 和 


java.beans.XMLDecoder 类 。 


Java7 对 将 JavaBeans 组 件 保 存 成 XML 文档 的 功能 做 了 更 新 ， 在 
XMLEncoder 类 中 增加 了 构造 方法 ， 可 以 更 加 精细 地 控制 保存 时 的 行 
为 。Java7 之 前 的 XMLEncoder 构 造 方 法 只 接受 一 个 java.io.OutputStream 
类 的 对 象 作 为 参数 ， 表 示 保 存 内 容 的 输出 流 。 而 Java7 新 增 的 构造 方法 
中 添加 了 额外 的 3 个 参数 ， 分 别 是 输出 时 使 用 的 字符 集 、 否 是 输出 XML 
处 理 指 令 声明 和 整个 XML 文档 的 缩 进 空格 数 。 人 允许 指定 输出 时 使 用 的 
字符 集 主要 是 为 了 满足 不 同 的 编码 格式 需求 ， 而 另外 两 个 参数 是 为 了 
使 输出 的 XML 文档 内 容 可 以 被 答 入 到 其 他 XML 文档 中 。 

用 于 读 取 XMLEncoder 类 的 输出 文档 的 XMLDecoder 类 也 有 一 些 更 
新 ， 主 要 是 提供 了 更 好 的 对 SAX 解 析 方 式 的 支持 。XMLDecoder 类 新 增 
了 一 个 接受 org.xml.sax.InputSource 类 型 参数 的 构造 方法 。 在 Java7 之 
前 ， 创 建 XMLDecoder 类 的 对 象 时 ， 只 能 使 用 InputStream 类 的 对 象 来 表 
示 解 析 时 的 输入 数据 。 而 InputSource 类 则 提供 了 更 加 丰富 的 方式 来 表 
示 输 入 数据 ， 除 了 InputStream 类 的 对 象 之 外 ， 还 支持 使 用 标示 符 和 
java.io.Reader 类 的 对 象 。 


4.6 本 章 小 结 


本 章 首先 针对 算法 相关 的 概念 、 优 化 建议 进行 了 陈述 ， 然 后 挑选 
了 一 些 较 有 代表 性 的 设计 模式 进行 了 深入 的 优化 建议 介绍 ， 接 下 来 对 
网 络 相关 、 数 据 库 相关 的 优化 建议 也 做 了 一 些 技 术 、 经 验 分 享 ， 最 后 
对 程序 设计 过 程 中 遇 到 的 示例 、 常 见 问题 做 了 一 些 总 结 和 分 享 。 


[1] 基于 哈 希 表 的 Map 接 口 的 实现 。 详 见 第 3 章 里 面 的 介绍 。 

[2] 快速 排序 (Quicksort) 是 对 冒 泡 排序 的 一 种 改进 。 快 速 排序 由 C.A.R.Hoare 在 1962 年 提出 。 

[3] 1988 年 由 麻 省 理工 学 院 的 Barbara Liskov 女 士 所 提出 。 

[4] 来 自 于 1987 年 美国 东北 大 学 (Northeastern University) 一 个 名 为 “<Demeter” 的 研究 项 目 。 

[5] Java 提 供 了 抽象 类 ClassLoader， 所 有 用 户 自 定义 类 装载 器 都 实例 化 自 ClassLoader 的 子 类 。 

[6] 即 面向 对 象 思想 。 

[7] NoSQL (NoSQL=Not Only SQL) ， 意 即 “ 不 仅仅 是 SQL”， 是 一 项 全 新 的 数据 库 革命 性 运动 ， 早 期 就 有 人 提出 ， 发 展 
至 2009 年 趋势 越发 高 涨 。NoSQL 的 拥护 者 们 提倡 运用 非 关 系 型 的 数据 存储 ， 相 对 于 铺天盖地 的 关系 型 数据 库 运 用 ， 这 一 

概念 无 疑 是 一 种 全 新 的 思维 的 注入 。 较 常用 的 有 列 式 数据 库 、 文 档 数据 库 、 图 形 数据 库 。 

[8] 来 源 Apache 官 方 网 站 。 

[9] 其 它 还 包括 If-Modified-Since，Expires，Cache-Control 等 。 

[10] 死 锁 是 操作 系统 层面 的 一 个 错误 ， 是 进程 死 锁 的 简称 ， 最 早 在 1965 年 由 Dijkstra 在 研究 银行 家 算法 时 提出 的 ， 它 是 
计算 机 操作 系统 乃至 整个 并 发 程序 设计 领域 最 难处 理 的 问题 之 一 。 


第 5 章 Java 并 行程 序 优化 建议 


“优先 发 展 公 共 交 通 ， 加 强 财政 保障 ， 确 立 公 共 交 通 引 领 和 支撑 城 
市 交通 发 展 的 格局 ; 加 快 推进 高 架 、 主 干道 、 快 速 路 、 停 车 场 (DR) 
及 地 铁 、 轻 轨 等 城市 交通 基础 设施 建设 ， 大 力 推进 停车 产业 化 发 展 ， 
构建 立体 交通 ， 强 化 城市 交通 管理 ， 提 高 城市 交通 运行 效能 。” 这 上 段 话 
出 自 《 中 国 奖 通报》 发表 的 文章 “浙江 综合 治 堵 提 升 城市 生活 品质 ”。 

程序 设计 优化 与 交通 治理 拥堵 有 一 定 的 相似 性 ， 都 可 以 开拓 程 序 
运行 线路 ， 多 通道 、 多 维度 同时 运行 程序 ， 这 些 并 行 方法 可 以 帮助 提 
高 程序 运行 速度 ， 本 章 我 们 融 来 针对 Java 并 行程 序 优化 建议 讨论 。 
M LM CE 

和 什么 是 多 线程 编程 及 优化 方式 。 

m 如 何 增加 程序 并 行 性 。 

m 如 何 调 优 锁 设计 机 制 |。 

m JDK 类 库 里 面 提供 了 哪些 有 用 的 方式 可 以 加 强 并 发 。 


5.1 并 行程 序 优化 概述 


我 们 知道 ， 即 使 是 单 核 处 理 器 也 支持 多 线程 执行 代码 ，CPU 通 过 
给 每 个 线程 分 配 CPU 时 间 片 的 方式 来 实现 这 个 机 制 。 时 间 片 方式 是 
CPU 分 配给 各 个 线程 的 时 间 长 度 ， 因 为 每 一 片 时 间 片 非常 短 ， 一 般 是 
几 十 曼 秒 ， 所 以 CPU 通过 不 停 地 切换 线程 执行 ， 直 我 们 感觉 多 个 线程 
是 同时 在 执行 的 ， 事 实 上 它们 是 不 停 地 被 轮转 切换 着 运行 的 ， 这 在 第 8 
章 关 于 CGroup 技 术 的 实践 中 可 以 看 到 ， 分 配 到 线程 的 CPU 核 是 不 停 地 
变换 的 ， 并 不 是 锁定 在 某 一 个 核 上 。 

既然 CPU 通过 时 间 片 分 配 算法 来 循环 执行 任务 ， 那 么 当前 任务 执 
行 一 个 时 间 片 后 切换 到 下 一 个 任务 。 但 是 在 切换 前 后 保存 上 一 个 任务 
的 状态 ， 以 便 下 次 切换 回 这 个 任务 时 ， 可 以 再 加 载 这 个 任务 的 状态 。 
所 以 任务 从 保存 到 再 加 载 的 过 程 就 是 一 次 上 下 文 切换 。 这 就 好 比 我 们 


同时 读 一 本 英文 原版 书 ， 当 发 现 不 认识 的 单词 时 ， 我 们 需要 碍 询 字 
典 ， 字 典 碍 询 完毕 后 我 们 还 是 可 以 回 到 英文 书 继续 读 下 去 ， 整 个 过 程 
就 是 所 谓 的 切换 过 程 。 

注意 ， 由 于 并 行程 序 与 串 行 程序 的 不 同 特点 ， 又 由 于 适用 于 串 行 
程序 的 一 些 数据 结构 不 是 线程 安全 的 ， 所 以 它们 并 不 能 直接 用 于 并 行 
环境 下 正常 工作 ， 对 于 什么 是 线程 不 安全 ， 我 们 会 在 5.1.4 节 举例 说 
BH. 


5.1.1 资源 限制 带 来 的 挑战 


资源 限制 是 指 在 进行 并 发 编程 时 ， 程 序 的 执行 速度 受 限 于 计算 机 
硬件 资源 或 软件 资源 。 例 如 ， 服 务 器 的 带宽 只 有 2Mb/s， 某 个 资源 的 下 
载 速 度 是 1Mb/s 每 秒 ， 系 统 启动 10 个 线程 下 载 资源 ， 下 载 速度 不 会 变 
10Mb/s， 所 以 在 进行 并 发 编程 时 ， 要 考虑 这 些 资源 的 限制 。 硬 件 资 源 
限制 主要 有 带宽 的 上 传 /下 载 速度 、 硬 盘 读 写 速 度 和 CPU 的 处 理 速 度 。 
软件 资源 限制 主要 有 数据 库 的 连接 数 和 Socket 连 接 数 等 。 

在 并 发 编程 中 ， 将 代码 执行 速度 加 快 的 原则 和 做 法 通常 是 将 代码 
中 串 行 执行 的 部 分 变 成 并 行 执行 。 但 是 如 果 将 某 段 串 行 的 代码 并 行 执 
行 ， 因 为 资源 受 限 ， 所 以 仍然 可 能 是 串 行 执行 ， 这 时 候 程序 不 仪 不 会 
加 快 执行 ， 反 而 会 更 慢 ， 因 为 程序 的 执行 过 程 中 增加 了 上 下 文 切换 和 
资源 调度 的 时 间 。 例 如 ， 一 段 程序 使 用 多 线程 在 办 公 网 内 部 并 发 下 载 
和 处 理 数据 ， 导 致 CPU 利 用 率 达 到 100%， 几 个 小 时 都 不 能 完成 任务 ， 
改 成 单线 程 后 一 个 小 时 就 可 执行 完成 。 

对 于 硬件 资源 限制 ， 可 以 考虑 使 用 集群 并 行 执 行程 序 。 通 俗 点 来 
说 就 是 ， 既 然 单机 的 资源 有 限制 ， 那 么 就 让 程序 在 多 人 台 机 器 上 运行 ， 
比如 使 用 Mesos 框 架 [1] 搭 建 服务 器 集群 ， 不 同 的 机 器 处 理 不 同 的 数据 。 

同 集中 式 系 统 相 比 较 ， 分 布 式 系统 的 一 个 潜在 的 优势 在 于 它 的 高 
可 靠 性 。 通 过 把 工作 负载 分 散 到 众多 的 机 器 上 ， 单 个 芯片 故 障 最 多 只 
会 使 一 台 机 器 停机 ， 其 他 机 器 不 会 受 任何 有 影响。 理想 条 件 下 ， 某 一 时 
刻 如 果 有 5% 的 计算 机 出 现 故 障 ， 系 统 仍 能 继续 工作 ， 只 是 损失 5% 的 性 
能 。 对 于 关键 性 的 应 用 ， 如 核反应 堆 或 飞机 的 控制 系统 ， 采 用 分 布 式 
系统 来 实现 主要 是 考虑 到 它 可 以 获得 高 可 靠 性 。 


在 现代 集群 里 ， 不 同 的 框架 所 要 求 的 计算 需求 非常 不 同 ， 企 业 需 
要 运行 多 种 框架 ， 并 在 其 间 共 享 数据 和 资产。 资源 管 理 程 序 面临 巨大 
的 挑战 和 互 为 矛盾 的 目标 。 

m 高 效 性 : 高 效 共 享 资 源 是 集群 管理 软件 的 终极 目标 。 

n 隔离 性 : 当 多 个 任务 共享 资源 时 ， 最 重要 的 考量 之 一 是 确保 资源 
的 隔离 性 。 隔 离 性 和 正确 调度 的 整合 是 保证 服务 级 别 协议 (SLA) 的 
基础 。 

m 可 伸缩 性 : 现代 基础 架构 的 持续 增长 要 求 集群 管理 程序 可 以 线性 
伸缩 。 一 个 重要 的 可 伸缩 性 指标 是 框架 伸缩 决策 制定 所 需 的 延 时 。 

n 健壮 性 : 集群 管理 是 中 央 组 件 ， 持 续 的 业务 运营 要 求 健壮 的 集群 
管理 。 从 展 好 测试 的 代码 到 容错 设计 ， 很 多 方面 都 有 助 于 提高 健壮 
性 。 

m 可 扩展 性 : 在 任何 公司 里 ， 集 群 管理 软件 的 开发 量 都 非常 大 ， 而 
且 这 些 软件 可 能 已 经 使 用 了 数 十 年 。 运 营 期 间 ， 企 业 政 策 和 /或 硬件 的 
变化 都 不 可 避免 地 要 求 集群 资源 管理 方式 的 改变 ， 因 此 ， 对 于 大 型 企 
业 来 说 ， 可 维护 性 非常 重要 。 集 群 管理 软件 必须 是 可 配置 的 ， 同 时 考 
虑 到 约束 条 件 (比如 位 置 、 硬 件 等 ) ， 并 且 需 要 能 够 支持 多 种 框架 。 

对 于 软件 资产 限制 ， 可 以 考虑 使 用 资源 池 将 资源 复 用 ， 以 此 提高 
资源 的 复 用 率 。 从 较 小 的 概念 来 理解 ， 比 如 使 用 连接 池 将 数据 库 和 
Socket 连 接 复 用 ， 或 者 在 调用 对 方 WebService 接 口 获 取 数 据 时 ， 同 时 只 
建立 一 个 连接 。 从 较 大 的 概念 来 讲 ， 将 计算 任务 分 布 在 可 动态 升级 和 
被 虚拟 化 的 资源 闻 上 ， 用 户 可 以 通过 网 络 很 方便 地 按 需 获取 计算 力 、 
存储 空间 和 信息 服务 。 这 种 新 的 基于 网 络 的 运算 方式 ， 通 过 网 络 为 用 
户 提供 可 按 需 使 用 的 服务 。 它 通过 分 布 式 处 理 、 虚 拟 化 、 在 线 软件 等 
技术 将 数据 中 心 的 计算 、 存 储 、 网 络 等 IT 基础 设施 ， 以 及 开发 平台 、 
软件 等 服务 抽象 成 可 运营 、 可 管理 的 开 资源 ， 通 过 互联 网 动态 提供 给 
用 户 ， 用 户 按 实 际 使 用 数量 进行 付费 ， 这 就 是 云 计 算 的 理念 。 

第 2 章 里 面 曾经 介绍 过 ， 传 统 的 冯 . 诺 依 曼 型 结构 已 经 无 法 满足 要 
求 ， 计 算 机 网 络 的 出 现 使 分 布 式 系 统 成 为 可 能 ， 并 得 到 飞速 发 展 和 应 
用 。 分 布 式 系统 是 并 行 计 算 的 有 力 推动 ， 所 谓 分 布 式 系 统 是 指 由 多 个 
相互 连接 的 处 理 资源 组 成 的 计算 机 系统 ， 计 算 机 之 间 通 过 消息 传递 进 
行 通 信和 动作 协调 ， 从 用 户 角度 来 看 ， 它 如 同一 个 集中 的 单机 系统 。 


大 多 数 分 布 式 系统 建立 在 计算 机 网 络 之 上 ， 网 络 中 的 计算 机 可 能 在 空 
间 上 有 距离 ， 可 能 在 不 同 的 国家 和 地 区 ， 也 可 能 在 同一 栋 楼 房 或 同一 
个 房间 。 分 布 式 系 统 中 的 每 个 节点 既 独 立 工作 ， 又 与 其 他 所 有 节点 并 
行 工作 。 每 个 节点 多 于 一 个 进程 〈 执 行程 序 ) ， 每 个 进程 多 于 一 个 线 
te 〈 并 行 执行 任务 ) ， 可 在 系统 中 充当 组 件 。 大 多 数组 件 具有 反应 
性 ， 对 来 自用 户 的 命令 和 来 自 其 他 组 件 的 消息 不 断 地 进行 响应 。 就 像 
我 们 每 天 都 要 使 用 的 操作 系统 一 样 ， 分 布 式 系 统 引 在 避免 服务 终止， 
因此 应 该 始终 保持 至 少 部 分 可 用 的 状态 。 

分 布 式 系统 中 服务 和 应 用 两 者 均 可 提供 被 客户 共享 的 资源 。 因 
此 ， 可 能 几 个 客户 同时 试图 访问 同一 个 共享 的 资源 。 例 如 ， 学 校 选课 
系统 的 效 据 库 在 选课 时 可 能 被 非 单 频繁 地 访问 。 最 简单 的 办 法 是 管理 
共 亨 资产 的 进程 在 一 个 时 刻 接受 一 个 客户 请 求 。 但 这 种 方法 限制 了 吞 
吐 量 ， 因 此 服务 和 应 用 通常 允许 并 发 地 处 理 多 个 客户 的 请 求 。 为 了 详 
细 说 明 这 个 问题 ， 我 们 假设 每 个 资源 被 封装 成 一 个 对 象 ， 调 用 在 并 发 
线程 中 执行 。 在 这 种 情况 下 ， 几 个 线程 可 能 在 一 个 对 象 内 并 发 地 执 
行 ， 它 们 对 于 对 象 的 操作 可 能 相互 冲突 ， 产 生 不 一 致 的 结果 。 为 了 使 
对 象 在 并 发 环境 中 能 安全 使 用 ， 对 象 的 同步 操作 必须 保持 数据 的 一 致 
性 。 这 可 以 通过 标准 的 技术 ， 如 在 大 多 数 操作 系统 使 用 的 信号 量 技术 
来 实现 。 


5.1.2 进程 、 线 程 、 协 程 


进程 是 操作 系统 结构 的 基础 ， 是 一 次 程序 的 执行 ， 是 一 个 程序 及 
其 数据 在 处 理 机 上 顺序 执行 时 所 发 生 的 活动 ， 是 程序 在 一 个 数据 集合 
上 运行 的 过 程 。 总 而 言 之 ， 进 程 是 系统 进行 资源 分 配 和 调度 的 一 个 独 
立 单位 。 

在 Java 程 序 中 可 能 需要 调用 底层 操作 系统 上 的 其 他 程序 ，Java 标 准 
API 提 供 了 创建 底层 操作 系统 上 运行 的 进程 的 能 力 ， 只 需要 传 入 正确 的 
命令 和 相关 的 参数 ， 就 可 以 启动 一 个 进程 。 在 进程 启动 之 后 ， 可 以 从 
Java 程 序 对 进程 提供 输入 数据 ， 以 及 读 取 进程 运行 过 程 中 产生 的 输出 数 
据 。 对 于 在 Java 程 序 中 启动 其 他 进程 这 个 任务 来 说 ， 最 重要 的 是 输入 和 
输出 的 处 理 。 通 常 的 做 法 是 把 Java 程 序 的 内 部 运行 结果 作为 输入 传递 给 
一 个 新 创建 的 进程 ， 然 后 等 街 进程 执行 完成 。 在 得 到 进程 输出 的 运行 


结果 之 后 ， 再 继续 下 面 的 处 理 。 通 过 这 种 方式 ， 底 层 操 作 系统 上 的 其 
他 进程 可 以 很 好 地 与 Java 程 序 集成 起 来 。 

在 Java7 之 前 ， 对 进程 的 输入 和 输出 进行 处 理 的 方式 比较 有 限 ， 只 
支持 管道 式 的 方式 。 进 程 的 输入 对 Java 程 序 来 说 是 一 个 输出 流 ， 程 序 向 
这 个 输出 流 中 写 入 的 数据 会 通过 管道 传递 给 进程 。 同 样 的 ， 进 程 的 输 
出 对 于 Java 程 序 来 说 是 一 个 输出 流 ， 通 过 读 取 此 输入 流 的 内 容 获 得 进程 
的 输出 。 标 准 的 创建 新 进程 的 过 程 是 使 用 java.lang.ProcessBuilder 类 来 
设置 新 进程 的 属性 ， 然 后 通过 start 方 法 来 启动 进程 的 执行 。 
ProcessBuilder 类 的 start 方 法 的 返回 值 是 一 个 表示 进程 的 java.lang.Process 
类 的 对 象 。 通 过 Process 类 的 getOutputStream 方 法 可 以 得 到 向 进程 写 入 
数据 的 i 出 流 ， 而 通过 getInputStream 和 getErrorStream 方 法 可 以 分 别 得 
到 包含 进程 正常 执行 和 出 错时 输出 内 容 的 输入 流 。 下 面 示例 代码 启动 
了 Windows 上 的 命令 行 工 具 来 执行 “netstat-a” 命 令 ， 并 把 结果 保存 到 一 
个 文件 中 。 


代码 清单 5-1 启动 命令 行 工具 
import java.io.IOException; 
import java.io.InputStream; 
import java.nio.file.Files; 


import java.nio.file.Paths; 


LT 


import java.nio.file.StandardCopyOption; 


public class StartProcess [ 

public void startProcessNormal() throws IOException[ 
ProcessBuilder pb = new ProcessBuilder ("cmd.exe", "/c", "netstat","-a") ; 
Process process = pb.start(); 
InputStream inputstream = process.getInputStream() ; 
Files.copy(inputstream, Paths.get ("netstat.txt"), 

StandardCopyOption.REPLACE EXISTING); 
} 


public static void main(String[] args) { 
StartProcess sp = new StartProcess(); 
try { 
sp.startProcessNormal () ; 
} catch (IOException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


| 


程序 运行 输出 如 清单 5-2 所 示 。 


代码 清单 5-2 ”清单 5-1 运行 输出 


活动 连接 
协议 本 地 地 址 外 部 地 址 状态 
TCP 0.0.0.0:135 
TCP 0.0.0.0:443 
TCP 0.0.0.0:445 
TCP 0.0.0.0:902 
TCP 0.0.0.0:912 
TCP 0.0.0.0:1025 
TCP 0.0.0.0:1026 
TCP 0.0.0.0:1027 
TCP 0.0.0.0:1028 
TCP 0.0.0.0:1031 
TCP 0.0.0.0:1032 
TOP 0.0.0.0:5904 
TCP 0.0.0.0:7909 
TCP 0.0.0.0:17866 
TCP 127.0.0.1:8307 
TCP 127.0.0.1:10000 
TCP 127.0.0.1:27018 
TCP 192.168.79.1:139 
TCP 192.168.154.1:139 
TCP [5312135 
TCP [5:]2443 
TCP [::1:445 
TCP [es]; 1UZ25 
TCP [::1:1026 
TCP I3:21:1027 
TCP [3313312028 
TCP [:25]/22031 
TCP [3274033 
TCP [333] £8307 
UDP 0.0.0.0:500 
UDP 0.0.0.0:4500 
UDP 0.0.0.0:5355 
UDP 0.0.0.0:9909 
UDP 0.0.0.0:17869 
UDP 0.0.0.0:17883 
UDP 0.0.0.0:18889 
UDP 0.0.0.0:50867 
UDP 127.0.0.1:40000 
UDP 127.0.0.1:60571 
UDP 192.168.79.1:137 
UDP 192.168.79.1:138 
UDP 192.168.154.1:137 
UDP 192.168.154.1:138 
UDP sie] e500 
UDP [ste die4500 


NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 0 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 
NB-ZHOUMINGYAO: 


sk 


on o o dO co o oO 


kex 
kek 


*exk 


LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 
LISTENING 


UDP [::1]:5355 EN 
UDP [£e80::a1ac:783b:9535:919c219]:546. *:* 
UDP [£e80::dd20:a40c:64b6:5747%20):546 *:* 


使 用 管道 的 方式 在 某 些 情况 下 显得 不 够 灵活 ， 因 此 Java7 对 进程 的 
输入 和 输出 处 理 进行 了 更 新 ， 增 加 了 另外 的 两 种 处 理 方式 。 第 一 种 是 
继承 式 ， 即 新 创建 进程 的 输入 和 输出 与 当前 的 Java 进 程 相同 。 第 二 种 是 
基于 文件 式 ， 即 把 文件 作为 进程 输入 的 来 源 和 输出 的 目的 。 下 面 是 一 
个 继承 式 的 例子 ， 其 中 启动 的 进程 通过 Windows 上 的 cmd 工 具 执 行 dir 命 
令 ， 通 过 ProcessBuilder 类 的 redirectOutput 方 法 把 进程 的 输出 设置 为 继承 
自 父 进 程 ， 运 行 的 结果 会 显示 在 Java 程 序 默认 的 输出 控制 台 上 。 


代码 清单 5-3 继承 式 示例 
public void startProcessBasedonJava7() throws IOException( 
ProcessBuilder pb = new ProcessBuilder ("cmd.exe", "/c", "dir"); 
pb. redirectOutput (Redirect.INHERIT); 
pb.start () ; 
} 


程序 运行 输出 如 下 所 示 。 


代码 清单 5-4 清单 5-3 运行 输出 
了 驱动 器 D 中 的 卷 没 有 标签 。 
卷 的 序列 号 是 0000-D09A 


D:\Project\Java8Project 的 目录 


2015/10/06 14:31 <DIR> 

2015/10/06 14:31 <DIR> 

2015/08/20 09:28 16,060 .classpath 

2015/01/21 11:21 388 .project 

2015/07/21 11:21 <DIR> settings 

2015/08/10 14:35 151,679 artoolkitplus-linux-x86.jar 
2015/08/10 14:35 23,677 artoolkitplus. jar 
2015/10/06 14:28 <DIR> bin 

2015/08/10 14:35 7,762,368 ffmpeg-linux-x86.jar 
2015/08/10 14:35 224,021 ffmpeg.jar 

2015/08/10 14:35 216,396 flycapture-linux-x86.jar 
2015/08/10 14:35 139,275 flycapture.jar 
2015/08/10 14:35 225,614 javacpp.jar 

2015/08/10 14:35 335,803 javacv.jar 

2015/08/10 14:35 158,490 1ibdc1394-linux-x86.jar 
2015/08/10 14:35 29,903 libdc1394.jar 

2015/08/10 14:35 78,666 libfreenect-linux-x86.jar 
2015/08/10 14:35 21,303 libfreenect.jar 
2015/10/06 14:31 3,085 netstat.txt 

2015/08/10 14:35 7,995,786 opencv-linux-x86.jar 
2015/08/10 14:35 813,781 opencv.jar 


2015/10/06 14:28 <DIR> src 
2015/09/01 15:32 8,088 temp 
2015/08/10 14:35 15,115 videoinput.jar 
19 个 文件 18,219,498 T$ 
5 个 目录 39,639,306,240 可 用 字 节 


如 果 和 希望 把 进程 的 输入 或 输出 改 为 文件 ， 那 么 可 以 使 用 
ProcessBuilder 类 中 的 redirectnput 和 redirectOutput 方 法 的 其 他 重 载 形 
式 。 下 面 的 例子 通过 一 个 文件 来 保存 进程 的 输出 内 容 。 


代码 清单 5-5 ”ProcessBuilderJava7 方式 


public void startProcessBasedonJava7 1() throws I0Exception{ 
ProcessBuilder pb = new ProcessBuilder("cmd.exe", "/c", "dir"); 
File output = Paths.get ("dir.txt") .toFile(); 
pb. redirectOutput (output); 
pb.start () ; 

} 


从 API 的 角度 来 说 ，Java7 通 过 新 增 的 ProcessBuilderRedirect 类 对 进 
程 的 输入 和 输出 重 定向 方式 进行 了 统一 。ProcessBuilderRedirect 类 提供 
了 两 种 直接 使 用 的 重 定向 类 型 ， 一 种 是 Java7 之 前 就 有 的 管道 式 ， 用 
ProcessBuilder.Redirect.PIPE 来 表示 。 另 一 种 是 前 面 介绍 的 继承 式 ， 用 
ProcessBuilder.Redirect.INHERIT 来 表示 。 其余 3 种 方式 都 是 与 文件 相关 
的 ， 在 使 用 时 都 需要 一 个 File 类 的 对 象 作 为 参数 。 
ProcessBuilder.Redirect.from 表示 从 一 个 文件 中 读 取 内 容 作 为 输入 ， 
ProcessBuilder.Redirect.to 表示 把 输出 写 入 一 个 文件 中 ， 
ProcessBuilder.Redirect.appendTo 表 示 把 输出 的 内 容 添 加 a 到 一 个 已 有 的 文 
件 中 。 

在 通过 ProcessBuilder 类 的 redirectInput 和 redirectOutput 方 法 将 输入 
和 输出 重 定 向 之 后 ， 如 果 新 的 输入 源 和 输出 目标 不 是 默认 的 管道 方 
式 ， 那 么 就 无 法 访问 所 创建 进程 的 Process 类 的 对 象 中 的 对 应 流 。 例 
如 ， 通 过 redirectInput 方 法 把 进程 的 输入 重 定 向 到 某 个 文件 之 后 ， 
Process 类 的 对 象 的 getOutputStream 方 法 返回 的 是 一 个 空 的 输出 流 ， 调 


用 该 输出 流 的 write 方法 总 是 会 抛 出 IOException 异 常 。 通 过 
redirectOutput 和 redirectError 方 法 把 进程 的 正常 和 错误 的 输出 重 定向 到 
某 个 文件 之 后 ，Process 类 的 对 象 的 getInputStream 和 getErrorStream 方 法 
返回 的 是 一 个 空 的 输入 流 ， 调 用 该 输入 流 的 read 方 法 总 是 会 返回 -1。 
此 ， 如 果 在 ProcessBuilder 类 的 对 象 中 对 进程 的 输入 或 输出 进行 了 重 定 
向 ， 那 么 相应 的 Process 类 的 对 象 使 用 者 一 定 要 了 解 这 一 点 ， 以 免 造 成 
使 用 错误 。 

线程 可 以 理解 成 是 在 进程 中 独立 运行 的 子 任务 。 比 如 ，QQ.exe 运 
行 时 就 是 很 多 的 子 任务 在 同时 运行 。 再 如 ， 好 友 视 频 线 程 、 下 载 文件 
线程 、 传 输 数 据 线程 、 发 送 表 情 线程 等 ， 这 些 不 同 的 任务 或 者 说 功能 
都 可 以 同时 运行 ， 其 中 每 一 项 任务 完全 可 以 理解 成 是 线程 在 工作 ， 这 
些 线程 都 在 后 台 运 行 着 。 这 样 做 有 什么 优点 呢 ? 更 具体 来 讲 ， 使 用 多 
线程 有 什么 优点 呢 ? 以 Windows 操 作 系 统 为 例 ， 可 以 最 大 限度 地 利用 
CPU 的 空 闪 时 间 来 处 理 其 他 的 任务 ， 比 如 一 边 让 操作 系统 处 理 正在 由 
打印 机 打印 的 数据 ， 一 边 使 用 Word 编 辑 文 档 。CPU 在 这 些 任务 之 间 不 
停 地 切换 ， 由 于 切换 的 速度 非常 快 ， 给 使 用 者 的 感受 就 是 这 些 任 务 似 
乎 在 同时 运行 。 所 以 使 用 多 线程 技术 后 ， 可 以 在 同一 时 间 内 运行 更 多 
不 同 种 类 的 任务 。 

在 多 核 时 代 ， 使 用 多 线程 可 以 明显 地 提高 系统 的 性 能 。 但 事实 
上 ， 使 用 多 线程 的 方式 会 额外 增加 系统 的 开销 。 对 于 单 任 务 或 者 单线 
程 的 应 用 而 言 ， 其 主要 资源 都 消耗 在 任务 本 身 。 它 既 不 需要 维护 并 行 
数据 结构 间 的 一 致 性 状态 ， 也 不 需要 为 线程 切换 和 调度 花费 时 间 ; 但 
对 于 多 线程 应 用 来 说 ， 系 统 除 了 处 理 功 能 需求 外 ， 还 需要 额外 维护 多 
线程 环境 的 特有 信息 。 例 如 ， 线 程 本 身 的 元 数据 、 线 程 的 调度 、 线 程 
上 下 文 的 切换 等 。 

事实 上 ,在 单 核 CrPU 上 ， 采 用 并 行 算法 的 效率 一 般 要 低 于 原始 的 
串 行 算法 。 其 根本 原因 也 在 此 ， 因 此 ， 并 行 计算 之 所 以 能 提高 系统 的 
性 能 ， 并 不 是 因为 它 “ 少 干 活 ”了 ， 而 是 因为 并 行 计算 可 以 更 合理 地 进 
行 任务 调度 。 因 此 ， 合 理 的 并 发 才能 将 多 核 CPU 的 性 能 发 挥 到 极致 。 

注意 ，Scala 和 Erlang 都 采用 了 角色 模型 来 进行 并 发 编程 ， 没 有 采 
用 线程 概念 。 围 绕 角 色 模 型 的 创新 并 不 仅 限 于 语言 本 身 ， 角 色 模 型 也 
可 供 Kilim 等 基于 Java 的 角色 框架 使 用 。 


简单 地 理解 ， 如 果 说 线程 是 对 进程 的 进一步 分 割 ， 那 么 协 程 是 对 
线程 的 进一步 分 割 。 无 论 是 进程 、 线 程 还 是 协 程 ， 在 逻辑 层 ， 它 们 都 
可 以 对 应 一 个 任务 ， 以 执行 一 段 逻 辑 代 码 ， 达 到 一 个 目标 。 当 使 用 协 
程 实现 一 个 任务 时 ， 协 程 并 不 完全 占据 一 个 线程 ， 当 一 个 协 程 处 于 等 
待 状态 时 ， 它 便 会 把 CPU 交 给 该 线程 内 的 其 他 协 程 。 与 线程 相 比 ， 协 
程 间 的 切换 更 为 轻便 ， 因 此 ， 具 有 更 低 的 操作 系统 成 本 和 更 高 的 任务 
并 发 性 。 

注意 ， 协 程 并 不 被 Java 语 言 原生 支持 。 在 Java 中 使 用 协 程 ， 可 以 使 
用 协 程 框 架 ，Kilim 就 是 一 个 比较 流行 的 协 程 框架 。 通 过 Kilim， 开 发 人 
员 可 以 以 较 低 的 开发 成 本 ， 将 协 程 引入 系统 。 


Kilim 是 一 个 使 用 Java 编 写 的 库 ， 融 入 了 角色 模型 的 概念 。 在 Kilim 
rH, “角色 ”是 使 用 Kilim 的 Task 类 型 来 表示 的 。Task 是 轻 量 型 的 线程 ， 
它们 通过 Kilim 的 Mailbox 类 型 与 其 他 Task 通 信 。Mailbox 可 以 接受 任何 
类 型 的 “消息 ”。 例 如 ，Mailbox 类 型 接受 java.lang.Object。Task 可 以 发 送 
String 消 息 或 者 甚至 自 定义 的 消息 类 型 ， 这 完全 取决 于 您 自己 。 

在 Kilim 中 ， 所 有 实体 都 通过 方法 签名 捆绑 在 一 起 ， 如 果 您 需要 同 
时 执行 几 项 操作 ， 可 以 在 一 个 方法 中 指定 该 行为 ， 扩 大 该 方法 的 签名 
以 抛 出 Pausable。 因 此 ， 在 Kilim 中 创建 并 发 类 就 像 在 Java 中 实现 
Runnable 或 扩展 Thread 一 样 简单 。 只 是 使 用 Runnable 或 Thread 的 附加 实 
体 (比如 关键 字 synchronized) 更 少 了 。 

最 后 ，Kilim 的 魔力 是 由 一 个 称 为 weaver 的 后 期 进程 来 实现 的 ， 该 
进程 转换 类 的 字 节 码 。 包 含 Pausablethrows 字 句 的 方法 在 运行 时 由 一 
调度 程序 处 理 ， 该 调度 程序 包含 在 Kilim 库 中 。 该 调度 程序 处 理 有 限 数 
量 的 内 核 线 程 。 可 以 利用 此 工具 来 处 理 更 多 的 轻 量 型 线程 ， 这 可 以 最 
大 限度 地 提高 上 下 文 切 换 和 局 动 的 速度 。 每 个 线程 的 堆栈 都 是 自动 管 
理 的 。 

通过 一 个 示例 实际 了 解 Kilim， 编 写 了 两 个 角色 ， 它 们 扩展 自 Kilim 
的 Task 类 型 。 这 些 类 会 以 一 种 并 发 方式 协同 工作 。DeferredDivision 对 象 
将 创建 一 个 被 除数 和 一 个 除数 ， 由 于 除法 运算 很 耗资 源 ， 所 以 
DeferredDivision 对 象 将 要 求 Calculator 类 型 来 处 理 该 任务 。 这 两 个 角 色 
通过 一 个 共享 Mailbox 实 例 保持 通信 ， = 实例 接受 一 个 Calculation 类 型 
返回 。 这 种 消息 类 型 非常 简单 ， 通 过 已 提供 的 被 除数 和 除 交 


Calculator 随 后 将 执行 计算 并 设 定 相应 的 答案 。 Calculator 然 后 将 这 个 
Calculation 实 例 传 回 共享 Mailbox 中 。 


Calculation 类 是 一 个 JavaBean， 这 个 类 


人 类 型 这 个 类 型 不 需要 任何 特殊 
的 Kilim 代 码 。 


代码 清单 5-6 Calculation 类 


import java.math.BigDecimal; 


public class Calculation { 
private BigDecimal dividend; 
private BigDecimal divisor; 


private BigDecimal answer; 


public Calculation(BigDecimal dividend, BigDecimal divisor) { 
super(); 

this.dividend = dividend; 

this.divisor - divisor; 


} 


public BigDecimal getDividend() { 
return dividend; 


} 


public BigDecimal getDivisor() { 
return divisor; 


} 


public void setAnswer (BigDecimal ans) { 
this.answer = ans; 


} 


public BigDecimal getAnswer () { 
return answer; 


} 


public String printAnswer() { 
return "The answer of " + dividend + " divided by " + divisor + 


" is " + answer; 


DeferredDivision 类 中 使 用 了 特定 于 Kilim 的 类 。 该 类 执行 多 项 操 
作 ， 但 总 体 来 讲 它 的 工作 非常 简单 : 使 用 随机 数 〈 类 型 为 BigDecimal) 
创建 Calculation 的 实例 ， 将 它们 发 送 到 Calculator 角 色 。 而 且 ， 该 类 还 会 
检查 共享 的 MailBox， 以 查看 其 中 是 否 有 任何 Calculation。 如 果 检 索 到 
的 一 个 Calculation 实 全 有 一 个 答案 ，DeferredDivision 将 打印 它 。 


代码 清单 5-7 DeferredDivision 类 
import java.math.BigDecimal; 
import java.math.MathContext; 
import java.util.Date; 


import java.util.Random; 


import kilim.Mailbox; 
import kilim.Pausable; 


import kilim.Task; 


public class DeferredDivision extends Task { 


private Mailbox<Calculation> mailbox; 


public DeferredDivision (Mailbox<Calculation> mailbox) { 
super () ; 
this.mailbox = mailbox; 


] 


@Override 
public void execute() throws Pausable, Exception { 
Random numberGenerator = new Random(new Date().getTime()); 
MathContext context = new MathContext (8); 
while (true) { 
System.out.println("I need to know the answer of something"); 
mailbox.putnb (new Calculation ( 
new BigDecimal(numberGenerator.nextDouble(), context), 
new BigDecimal (numberGenerator.nextDouble(), context))); 
Task.sleep (1000); 
Calculation answer = mailbox.getnb(); // no block 
if (answer != null && answer.getAnswer() != null) { 
System.out.println("Answer is: " + answer.printAnswer()); 
} 
} 


从 上 面 的 代码 可 以 看 到 ，DeferredDivision 类 扩展 了 Kilim 的 Task 类 
型 ， 后 者 实际 上 模仿 了 角色 模型 。 注 意 ， 该 类 还 改写 了 Task 的 execute 
方法 ， 后 者 默认 情况 下 抛 出 Pausable。 因 此 ，execute 的 操作 将 在 Kilim 
的 调度 程序 控制 下 进行 。 也 就 是 说 ，Kilim 将 确保 execute 以 一 种 安全 的 
方式 并 行 地 运行 。 在 execut 方 法 内 部 ，DeferredDivision 创 建 Calculation 
的 实例 并 将 它们 放 在 Mailbox 中 。 它 使 用 putnb 方 法 以 一 种 非 阻 塞 方式 完 
成 此 任务 。 填 充 mailbox 后 ，DeferredDivision 进 入 休眠 状态 。 注 意 , 5 
处 于 休眠 状态 的 内 核 线程 不 同 ， 它 是 由 Kilim 托 管 的 轻 量 型 线程 。 当 角 
色 唤 醒 之 后 ,， 像 前 面 提 到 的 一 样 ， 它 在 mailbox 中 查找 任何 
Calculation。 此 调用 也 是 非 阻塞 的 ， 这 意味 着 getnb 可 以 返回 null。 如 果 
DeferredDivision 找 到 一 个 Calculation 实 例 ， 并 且 该 实例 的 getAnswer 方 
法 有 一 个 值 〈 也 就 是 说 ， 不 是 一 个 已 由 Calculator 类 型 处 理 过 的 
Calculation 实 例 ) ， 它 将 该 值 打 印 到 控制 从。 

Mailbox 的 另 一 端 是 Calculator。 与 清单 5-7 中 定义 的 DeferredDivision 
角色 类 似 ，Calculator 也 扩展 了 Kilim 的 Task 并 实现 了 execute 方 法 。 一 定 
要 注意 两 个 角色 都 共享 同一 个 Mailbox 实 例 。 它 们 不 能 与 不 同 的 Mailbox 
通信 ， 它 们 需要 共享 一 个 实例 。 相 应 地 ， 两 个 角色 都 通过 它们 的 构造 
图 数 接受 一 个 有 类 型 Mailbox。 

Calculator 的 execute 方 法 与 DeferredDivision 的 相应 方法 一 样 ， 不 断 
循环 查找 共享 Mailbox 中 的 项 。 区 别 在 于 Calculator 调 用 get 方 法 ， 这 是 一 
种 阻塞 调用 。 相 应 地 ， 当 一 条 Calculation“ 消 息 ” 显 示 时 ， 它 执行 请 求 的 
除法 运算 。 最 后 ，Calculator 将 修改 的 Calculation 放 回 到 Mailbox 中 (X 
用 非 阻 塞 方式 ) ， 然 后 进入 休眠 状态 。 两 个 角色 中 的 休眠 调用 都 仅 用 
于 简化 控制 台 的 读 取 。 


代码 清单 5-8 Calculator 类 


import java.math.RoundingMode; 


import kilim.Mailbox; 
import kilim.Pausable; 


import kilim.Task; 
public class Calculator extends Task{ 
private Mailbox<Calculation> mailbox; 


public Calculator (Mailbox<Calculation> mailbox) { 
super () ; 
this.mailbox = mailbox; 


} 


@Override 
public void execute() throws Pausable, Exception { 
while (true) { 
Calculation calc = mailbox.get(); // blocks 
if (calc.getAnswer() == null) { 
calc.setAnswer (calc.getDividend() .divide(calc.getDivisor(), 8, 
RoundingMode.HALF UP)); 
System.out.println("Calculator determined answer"); 
mailbox.putnb (calc); 
} 
Task. sleep (1000) ; 
} 
} 
} 


接 下 来 我 们 就 可 以 将 这 两 个 角色 应 用 到 实际 中 就 像 在 Java 代 码 中 应 
用 两 个 普通 的 Thread 一 样 。 使 用 同一 个 共享 sharedMailbox 实 例 创 建 并 扩 
展 两 个 角色 实例 ， 然 后 调 start 方 法 来 实际 设置 。 


代码 清单 5-9 CalculateMain 类 
import kilim.Mailbox; 


import kilim.Task; 


public class CalculateMain { 
public static void main(String[] args) { 
Mailbox<Calculation> sharedMailbox = new Mailbox<Calculation>(); 


Task deferred = new DeferredDivision(sharedMailbox) ; 


Task calculator = new Calculator (sharedMailbox) ; 


deffered.start (); 


calculator.start(); 


} 
} 


综合 上 面 的 这 些 陈 述 ， 我 们 可 以 理解 清楚 进程 、 线 程 、 协 程 的 关 
系 。 现 代 的 多 任务 操作 系统 的 典型 特征 是 对 进程 的 支持 ， 进 程 是 一 种 
重量 级 的 任务 调度 方式 ， 进 程 创建 、 调 度 和 和 上下文 切换 需要 花费 较 多 
的 系统 资源 。 因 此 ， 进 程 的 并 发 性 是 非常 有 限 的 。 为 了 增加 操作 系统 
的 并 发 性 ， 人 和 人们 提出 了 线程 ， 线 程 也 称 为 轻 量 级 进行 ， 它 的 创建 和 切 
换 消耗 远 远 低 于 进程 ， 正 是 由 于 这 个 原因 ， 使 用 线程 作为 并 发 控制 的 
基本 单元 ， 可 以 使 应 用 程序 拥有 更 高 的 并 发 能 力 。 与 进程 相 比 ， 线 程 
是 一 个 较为 轻 量 级 的 并 行程 序 解决 方案 。 但 是 ， 对 于 高 并 发 程序 而 
言 ， 线 程 对 系统 资源 的 占用 量 依然 不 小 ， 这 也 限制 了 系统 的 并 发 数 。 
为 了 进一步 提升 系统 的 并 发 数量 ， 可 以 对 线程 进一步 分 割 ， 即 所 谓 的 
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协 程 。 随 着 应 用 程序 日 趋 复杂 ， 软 件 对 程序 并 发 度 的 要 求 也 越 来 越 
高 。 在 超 高 并 发 量 的 环境 中 ， 线 程 也 可 能 会 显得 相对 沉重 。 操 作 系统 
会 花费 较 多 的 时 间 在 进程 或 线程 的 切换 ， 为 了 使 系统 能 够 支持 更 高 的 
并 行 度 ， 便 有 了 协 程 的 概念 。 


5.1.3 使 用 多 线程 的 原因 


现代 操作 系统 在 运行 一 个 程序 时 ， 会 为 其 创建 一 个 进程 。 例 如 ， 
启动 一 个 Java 程 序 ， 操 作 系 统 就 会 创建 一 个 Java 进 程 。 现 在 操作 系统 调 
度 的 最 小 单元 是 线程 ， 也 叫 轻 量 级 进程 (Light Weight Process) ， 在 一 
个 进程 里 可 以 创建 多 个 线程 ， 这 些 线程 都 拥有 各 自 的 计数 器 、 堆 栈 和 
局 部 变量 等 属性 ， 并 且 能 够 访问 共享 的 内 存 变量 。 处 理 器 在 这 些 线程 
上 高 速 切 换 ， 让 使 用 者 感觉 到 这 些 线程 在 同时 执行 。 

一 个 Java 程 序 从 main () 方法 开始 执行 ， 然 后 按照 既定 的 代码 逻辑 
执行 ， 看 似 没 有 其 他 线程 参与 ， 但 实际 上 Java 程 序 天 生 就 是 多 线程 程 
序 ， 因 为 执行 main() 方法 的 是 一 个 名 称 为 main 的 线程 。 

使 用 多 线程 的 几 个 原因 : 

(1) 随 着 处 理 器 上 的 核心 数量 越 来 越 多 ， 以 及 超 线程 技术 的 广泛 
应 用 ， 现 在 大 多 数 计 算 机 都 更 加 擅长 并 行 计算 ， 而 处 理 器 性 能 的 提升 
方式 ， 也 从 更 高 的 主 频 向 更 多 的 核心 发 展 。 如 何 利 用 好 处 理 器 上 的 多 
个 核心 也 成 了 现在 的 主要 问题 。 

线程 是 大 多 数 操作 系统 调度 的 基本 单元 ， 一 个 程序 作为 一 个 进程 
来 运行 ， 程 序 运行 过 程 中 能 够 创建 多 个 线程 ， 而 一 个 线程 在 一 个 时 刻 
只 能 运行 在 一 个 处 理 器 核心 上 。 就 是 说 ， 一 个 单线 程 程序 在 运行 时 只 
能 使 用 一 个 处 理 器 核心 ， 所 以 那么 再 多 的 处 理 器 核心 加 上 也 无 法 显著 
提升 该 程序 的 执行 效率 。 相 反 ， 如 果 该 程序 使 用 多 线程 技术 ， 将 计算 
逻辑 分 配 到 多 个 处 理 器 核心 上 ， 就 会 显著 减少 程序 的 处 理 时 间 ， 并 且 
随 着 更 多 处 理 器 核心 的 加 入 而 变 得 更 有 效率 。 

(2) 有 了 时 我 们 会 编写 一 些 较为 复杂 的 业务 逻辑 程序 ， 用 户 从 单 击 
某 个 按钮 开始 ， 就 要 等 待 这 些 操作 全 部 完成 才能 看 到 全 部 逻辑 完成 的 
结果 。 但 是 这 么 多 业务 操作 ， 如 何 能 够 让 其 更 快 地 完成 呢 ? 可 以 使 用 
多 线程 技术 ， 即 将 数据 一 致 性 不 强 的 操作 派发 给 其 他 线程 处 理 ， 也 可 
以 使 用 消息 队列 ， 例 如 生成 订单 快照 、 发 送 邮件 等 。 这 样 做 的 好 处 是 


相应 用 户 请 求 的 线程 能 够 尽 可 能 快 地 处 理 完 成 ， 缩 得了 响应 时 间 ， 提 
升 了 用 户 体验 。 

(3) Java 为 多 线程 编程 提供 了 良好 、 考 究 并 且 一 致 的 编程 模型 ， 
使 开发 人 员 能 够 更 加 专注 于 问题 的 解决 ， 即 为 所 遇 到 的 问题 建立 合适 
的 模型 ， 而 不 是 绞 尽 脑汁 地 考虑 如 何 将 其 多 线程 化 。 一 旦 开发 人 员 建 
立 好 了 模型 ， 稍 作 修改 总 是 能 够 方便 地 影射 到 Java 提 供 的 多 线程 编程 模 
型 上 。 

开发 人 员 经 常会 遇 到 这 样 的 方法 调用 情景 ， 调 用 一 个 方法 时 等 待 
一 段 时 间 ， 一 般 来 说 是 给 定 一 个 时 间 段 ， 如 果 该 方法 能 够 在 给 定 的 时 
间 段 之 内 得 到 结果 ， 那 么 结果 将 立刻 返回 ， 反 之 ， 超 时 返回 默认 结 
果 。 假 设 超时 时 间 段 是 IT， 则 可 以 推断 出 在 当前 时 间 now+T 之 后 就 会 超 
时 。 

我 们 假设 定义 如 下 变量 : 

(1) 等 待 持 续 时 间 : REMAINING=T; 
(2) 超时 时 间 : FUTURE=now+T。 

这 时 仅 需 要 wait (REMAINING) 即 可 ， 在 wait (REMAINING) 
返回 之 后 会 执行 REMAINING=FUTURE-now。 如 果 REMAINING 小 于 
等 于 0， 表示 已 经 超时 ， 直接 退出 ， 否 则 将 继续 执行 wait 

(REMAINING) 。 
上 述 描 述 等 待 超 时 模式 的 伪 代 码 如 下 。 


代码 清单 5-10 等待 超 时 模式 的 伪 代 码 
IRANA RAO 
public synchronized Object get(long mills) throws InterruptedException{ 
long future = System.currentTimeMills()+mills; 
long remaining = mills; 
// 当 超时 大 于 0 并 且 result 返回 值 不 满足 要 求 时 
while((result == null) && remaining>0) { 
wait (remaining) ; 
remaining = future - System.currentTimeMills(); 
} 
return result; 


} 


可 以 看 出 ， 等 待 超时 模式 就 是 在 等 待 /通知 范式 基础 上 增加 了 超时 
控制 ， 这 使 得 该 模式 相 比 原 有 范式 更 具有 灵活 性 ， 因 为 即使 方法 执行 
时 间 过 长 ， 也 不 会 “永久 ”阻塞 调用 者 ， 而 是 会 按照 调用 者 的 要 求 “按时 ” 
返回 。 


5.1.4 线程 不 安全 范例 


所 谓 线 程 安全 就 是 多 线程 访问 时 ， 采 用 了 加 锁 机 制 ， 当 一 个 线程 
访问 该 类 的 某 个 数据 时 ， 进 行 保护 ， 其 他 线程 不 能 进行 访问 直到 该 线 
程 读 取 完 ， 其 他 线程 才 可 使 用 。 不 会 出 现 数据 不 一 致 或 者 数据 污染 。 
线程 不 安全 就 是 指 不 提供 数据 访问 保护 ， 有 可 能 出 现 多 个 线程 先后 更 
改 数据 造成 所 得 到 的 数据 是 脏 数据 。 

我 们 来 举 一 个 例子 。 类 SimpleDateFormat 主 要 负责 日 期 的 转换 与 格 
式 化 ， 但 在 多 线程 的 环境 中 ， 使 用 此 类 容易 造成 数据 转换 及 处 理 的 不 
准确 ， 因 为 SimpleDateFormat 类 并 不 是 线程 安全 的 。 下 面 示例 将 实现 使 
用 类 SimpleDateFormat 在 多 线程 环境 下 处 理 日 期 但 得 出 的 结果 却 是 错误 
的 情况 ， 这 也 是 在 多 线程 环境 开发 中 很 容易 遇 到 的 问题 。 


代码 清单 5-11 类 simpleDateThread 
import java.text.ParseException; 
import java.text.SimpleDateFormat; 


import java.util.Date; 


public class simpleDateThread extends Thread{ 
private SimpleDateFormat sdf; 
private String dateString; 
public simpleDateThread(SimpleDateFormat sdf,String dateString) { 
super(); 
this.sdf - sdf; 
this.dateString = dateString; 
} 
public void run()( 
try{ 
Date dateRef = sdf.parse(dateString) ; 
String newDateString = sdf.format (dateRef) .toString(); 
if (!newDateString.equals (dateString) ) { 
System.out.printin("ThreadName="+this.getName () 
+" 报 错 了 日 期 字符 串 :"+dateString+" 转 换 成 的 日 期 为 :" 
*newDateString); 
} 
)catch(ParseException ex) { 
ex.printStackTrace(); 
} 
} 


代码 清单 5-12 3€ simpleDateDemo 


import java.text.SimpleDateFormat; 


public class simpleDateDemo { 
public static void main(String[] args) { 

SimpleDateFormat sdf = new SimpleDateFormat ("yyyy-MM-dd") ; 

String[] dateStringArray = new String[] {"2000-01-01","2010-01-01", 
"2002-01-01", "2003-01-01", 
"2004-01-01","2005-01-01", 
"2006-01-01", "2007-01-01", 
"2008-01-01", "2009-01-01" 

}; 

simpleDateThread[] threadArray = new simpleDateThread[10]; 


for(int 1=0;1<10;i++) { 

threadArray[i] = new simpleDateThread(sdf,dateStringArray[i]); 
} 
for(int 1=0;1<10;it+) { 


threadArray[i].start(); 


} 


输出 结果 如 清单 所 示 。 


代码 清单 5-13 ”多 线程 不 安全 输出 
ThreadName=Thread-9 报 错 了 日 期 字符 串 :2009-01-01 转换 成 的 日 期 为 :1002-01-01 
ThreadName=Thread-2 报错 了 日 期 字符 串 ;2002-01-01 转换 成 的 日 期 为 ;1002-01-01 


从 打印 结果 来 看 ， 使 用 单 例 的 SimpleDateFormat 类 在 多 线程 的 环境 
中 处 理 日 期 ， 容 易 出 现 日 期 转换 错误 的 情况 。 

如 果 我 们 新 增 一 个 类 DateTools， 它 里 面 实现 静态 的 parse 方 法 ， 让 
多 线程 程序 调用 该 parse 方 法 ， 可 以 解决 上 面 出 现 的 多 线程 不 安全 问 
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代码 清单 5-14 DateTools 类 
import java.text.ParseException; 
import java.text.SimpleDateFormat; 


import java.util.Date; 


public class DateTools { 
public static Date Parse(String formatPattern,String dateString) throws 
ParseException( 
return new SimpleDateFormat (formatPattern).parse (dateString); 
} 
public static String format(String formatPattern,Date date) { 
return new SimpleDateFormat (formatPattern) . format (date) .toString(); 
} 
} 


然后 把 类 simpleDateThread 里 面 try 块 的 前 两 行 代 码 改 为 如 下 所 示 ， 
就 能 解决 多 线程 不 安全 问题 。 


代码 清单 5-15 simpleDateThread 
Date dateRef = DateTools.Parse("yyyy-MM-dd", dateString); 
String newDateString = DateTools.format ("yyyy-MM-dd", dateRef).toString(); 


5.1.5 重 排序 机 制 | 


在 计算 机 中 ， 软 件 技术 和 硬件 技术 有 一 个 共同 的 目标 ， 在 不 改变 
程序 执行 结果 的 前 提 下 ， 尽 可 能 提高 并 行 度 ， 重 排序 就 是 这 样 的 一 种 
手段 。 

重 排序 指 的 是 编译 器 和 处 理 器 为 了 优化 程序 性 能 为 对 指令 序列 进 
行 重新 排序 的 一 种 手段 。 如 果 两 个 操作 访问 同一 个 变量 ， 且 这 两 个 操 
作 中 有 一 个 为 写 操作 ， 此 时 这 两 个 操作 之 间 就 存在 数据 依赖 性 。 例 


如 ，a=1，b=a， 这 是 一 个 写 后 读 的 示例 ， 即 在 写 一 个 变量 之 后 ， 再 读 
这 个 位 置 。 只 要 重 排序 两 个 操作 的 执行 顺序 ， 程 序 的 执行 结果 就 会 被 
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前 面 提 到 过 ， 编 译 器 和 处 理 器 可 能 会 对 操作 做 重 排序 。 编 译 器 和 
处 理 器 在 重 排序 时 ， 会 遵守 数据 依赖 性 ， 编 译 器 和 处 理 器 不 会 改变 存 
在 数据 依赖 关系 的 两 个 操作 的 执行 顺序 。 

注意 ， 这 里 所 说 的 数据 依赖 性 仅 针 对 单个 处 理 器 中 执行 的 指令 序 
列 和 单个 线程 中 执行 的 操作 ， 不 同 处 理 器 之 间 和 不 同 线程 之 间 的 数据 
依赖 性 不 被 编译 器 和 处 理 器 考虑 。as-if-serial 语 义 的 意思 是 ， 不 管 怎 么 
重 排序 (编译 器 和 处 理 器 为 了 提高 并 行 度 ) , (PAE) 程序 的 执行 
结果 不 能 被 改变 。 编 译 器 、runtime 和 处 理 器 都 必须 遵守 as-if-serial 语 
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为 了 遵守 as-if-serial 语 义 ， 编 译 器 和 处 理 器 不 会 对 存在 数据 依赖 关 
系 的 操作 做 重 排序 。 因 为 这 种 重 排序 会 改变 执行 结果 。 但 是 ， 如 果 才 
做 之 间 不 存在 数据 依赖 关系 ， 这 些 操作 就 可 能 被 编译 器 和 处 理 器 重 排 
序 。 例 如 一 个 例子 ， 计 算 圆 面积 的 公式 如 下 : 

double pi=3.14;//A 

double r=1.0;//B 

double area-pi*r*r;//C 

A 和 C 之 间 存 在 数据 依赖 关系 ， 同 时 B 和 C 之 间 也 存在 数据 依赖 关 
系 。 因 此 在 最 终 执行 的 指令 序列 中 ，C 不 能 被 重 排序 到 A 和 B 的 前 面 (C 
排 到 A 和 B 的 前 面 ， 程 序 的 结果 将 会 被 改变 ) 。 但 A 和 B 之 间 没 有 数据 依 
赖 关 系 ， 编 译 器 和 处 理 器 可 以 重 排序 A 和 B 之 间 的 执行 顺序 。 这 样 JMM 
并 不 要 求 A 一 定 要 在 B 之 前 执行 。JMM 仅 仅 要 求 前 一 个 操作 (执行 的 结 
R) 对 吼 一 个 操作 可 见 ， 且 前 一 个 操作 按 顺 序 排 在 第 二 个 操作 之 前 。 
这 里 操作 A 的 执行 结果 不 需要 对 操作 B 可 见 。 在 这 种 情况 下 ，JMM 会 认 
为 这 种 重 排序 并 不 非法 ， 即 JMM 人 允许 这 种 重 排序 。 

我 们 来 看 一 下 重 排 序 是 否 会 对 多 线程 程序 产生 影响 ， 假 设 我 们 有 
如 下 一 个 示例 代码 。 


代码 清单 5-16 类 ReorderDemo 
class ReorderDemo ( 
int a = 0; 


boolean flag = false; 


public void writer() { 
a=; //1 
flag = true; //2 
} 


Public void reader() { 
if (flag) | /[3 
inti= a*a; / [A 


假设 有 两 个 线程 A 和 B，A 首 先 执行 writer () 方法 ， 随 后 B 线 程 接 
着 执行 reader () 方法 。 线 程 B 在 执行 操作 4 时 ， 能 否 看 到 线程 A 在 操作 
1 对 共享 变量 a 的 写 入 ? 注意 ， 上 面 的 代码 中 ，flag 变 量 是 个 标记 ， 用 来 
标识 变量 a 是 否 已 被 写 入 。 

答案 是 不 一 定 能 够 看 到 。 由 于 操作 1 和 操作 2 没有 数据 依赖 关系 ， 
编译 器 和 处 理 器 可 以 对 这 两 个 操作 重 排 序 ; 同样 ， 操 作 3 和 操作 4 没有 
数据 依赖 关系 ， 编 译 器 和 处 理 器 也 可 以 对 这 两 个 操作 重 排序 。 让 我 们 
先 来 看 看 ， 当 操作 1 和 操作 2 重 排序 时 ， 可 能 会 产生 什么 效果 ? 请 看 下 
面 的 程序 执行 时 序 图 。 

如 图 5-1 所 示 ， 操 作 1 和 操作 2 做 了 重 排序 。 程 序 执行 时 ， 线 程 A 首 
先 写 标记 变量 flag， 随 后 线程 B 读 这 个 变量 。 由 于 条 件 判 断 为 真 ， 线 程 
B 将 读 取 变 量 a。 此 时 ， 变 量 a 还 根本 没有 被 线程 A 写 入 ， 在 这 里 多 线程 
程序 的 语义 被 重 排序 破坏 了 。 


Ez A «EB 


时 间 


图 5-1 程序 执行 时 序 图 

由 此 ， 我 们 可 以 得 出 结论 ， 在 单线 程 程 序 中 ， 对 存在 控制 依赖 的 
操作 重 排 序 ， 不 会 改变 执行 结果 (这 也 是 as-if-serial 语 义 允 许 对 存在 控 
制 依 赖 的 操作 做 重 排 序 的 原因 ) ; 但 在 多 线程 程序 中 ， 对 存在 控制 依 
赖 的 操作 重 排序 ， 可 能 会 改变 程序 的 执行 结果 。 


5.1.6 实例 变量 的 数据 共享 
自 定义 线程 类 中 的 实例 变量 针对 其 他 线程 可 以 有 共享 和 不 共享 两 


种 ， 这 在 多 线程 之 间 进 行 交 互 时 是 很 重要 的 一 个 技术 点 。 我 们 首先 来 
看 一 下 不 共享 数据 的 情况 ， 代 码 如 代码 清单 5-17 所 示 。 


代码 清单 5-17 不 共享 数据 示例 
public class unShareThread extends Thread{ 


private int count = 5; 


public unShareThread(String name) { 
super () ; 
this.setName (name) ;// 设 置 线程 名 称 


public void run() { 


super.run(); 
while(count > 0) { 
count--; 


System.out.println(this.currentThread().getName()+", count="tcount) ; 


} 


清单 5-17 程 序 的 运行 输出 如 清单 5-18 所 示 。 


代码 清单 5-18 不 共享 数据 示例 运行 输出 
unt=4 
unt=3 
unt=2 
unt=1 
unt=4 
unt=3 
unt=2 
unt=1 
unt-0 
unt=0 
unt=4 
unt=3 
unt=2 
unt=1 
unt=0 


从 上 面 输出 可 以 看 到 ， 程 序 当 中 一 共 创 建 了 3 个 线程 ， 每 个 线程 都 
有 各 自 的 count 变 量 ， 自 己 减少 自己 的 count 变 量 的 值 。 这 样 的 情况 就 是 
变量 不 共享 ， 这 个 例子 当中 并 不 存在 多 个 线程 访问 同一 个 实例 变量 的 
情况 。 

共享 数据 的 情况 就 是 多 个 线程 可 以 访问 同一 个 变量 ， 比 如 ， 实 现 
及 票 功 能 的 软件 ， 多 个 线程 可 以 同时 处 理 同 一 个 人 的 票数 。 代 码 如 代 
码 清单 5-19 所 示 。 


fo 
Q Q Q Q Q Q Q 
o o o o O O o 


Q 
o 


Q Q Q Q 
o o o O 


Q 
o 


Co Co Co Co Co — nM» Do nM» nM» M» r3 t bh 
~ 
Q 
o 


Q 
o 


代码 清单 5-19 共享 数据 示例 
public class sharedThread extends Thread{ 
private int count = 5; 
public void run() { 
super.run(); 
count--; 


System.out.println(this.currentThread() .getName () *"count2"4count) ; 


public class runClass { 
public static void main(String[] args) { 


sharedThread mythread = new sharedThread() ; 


Thread aa = new Thread (mythread, "aa"); 
Thread bb = new Thread (mythread, "bb") ; 


Thread cc = new Thread (mythread, "cc"); 
aa.start (); 
bb.start(); 


cc. start (); 


运行 代码 后 输出 为 aacount=4bbcount=3cccount=2。 可 以 看 到 ， 线 程 
aa，bb，cc 同 时 都 对 count 进 行 处 理 ， 产 生 了 * 非 线程 安全 ”问题 。 在 某 些 
JVM, i 一 的 操作 要 分 成 3 个 步骤 : 


(1) 取得 原 有 i 值 。 

(2) 计算 i-1。 

(3) 对 i 赋值 。 

在 这 3 个 步骤 中 ， 如 果 有 多 个 线程 同时 访问 ， 那 么 一 定 会 出 现 非 线 
程 安全 问题 。 


可 以 通过 加 synchronized 的 方式 让 多 个 线程 之 间 进 行 同 步 ， 也 就 是 
按 顺序 排队 的 方式 减 1。 

上 面 的 例子 中 通过 在 run 方 法 前 加 上 synchronized 关 键 子 ， 使 多 个 线 
程 在 执行 run 方 法 时 ， 以 排队 的 方式 进行 处 理 。 当 一 个 线程 调用 run 前 ， 
先 判 断 run 方 法 有 没有 被 上 锁 ， 如 果 上 锁 ， 说 明 有 其 他 线程 正在 调用 run 
方法 ， 必 须 等 其 他 线程 调用 结束 后 才 可 以 执行 ran 方法。synchronized 可 
以 在 任意 对 象 及 方法 上 加 锁 ， 而 加 锁 的 这 段 代码 称 为 * 互 斥 区 ?或 “临界 
区 ”。 

当 一 个 线程 想 要 执行 同步 方法 里 面 的 代码 时 ， 线 程 首 先 尝试 去 拿 
这 把 锁 ， 如 果 能 够 拿 到 锁 ， 那 么 该 线程 就 可 以 执行 synchronized 里 面 的 
代码 。 如 果 拿 不 到 锁 ， 那 么 这 个 线程 就 会 不 断 党 试 拿 这 把 锁 ， 直 到 能 
够 拿 到 为 止 ， 而 且 是 有 多 个 线程 同时 去 争夺 这 把 锁 。 

非 线 程 安全 指 的 是 多 个 线程 对 同一 个 对 象 中 的 同一 个 实例 变量 进 
行 操作 时 会 出 现 值 被 更 改 、 值 不 同步 的 情况 ， 进 而 影响 程序 的 执行 流 
程 ， 即 产生 所 谓 的 “ 脏 读 ”。 

线程 安全 指 的 是 同样 情况 下 ， 获 得 实例 变量 的 值 是 经 过 同步 处 理 
的 ， 不 会 出 现 脏 读 的 现象 。 

非 线 程 安全 问题 存在 于 实例 变量 中 ， 如 果 是 方法 内 部 的 私有 变 
则 不 存在 非 线 程 安全 问题 ， 所 得 结果 也 就 是 线程 安全 的 了 。 


5.1.7 生产 者 与 消费 者 模式 


生产 者 消费 者 问题 是 研究 多 线程 程序 时 绕 不 开 的 经 典 问题 之 一 ， 
我 们 可 以 把 整个 问题 的 场景 描述 为 有 一 块 缓冲 区 作为 仓库 ， 生 产 者 可 
以 将 产品 放 入 仓库 ， 消 费 者 则 可 以 从 仓库 中 取 走 产品 。 解 决 生产 者 / 消 
费 者 问题 的 方法 可 分 为 两 类 : 

(1) 采用 某 种 机 制 保护 生产 者 和 消费 者 之 间 的 同步 ; 

(2) 在 生产 者 和 消费 者 之 间 建 立 一 个 管道 。 

第 一 种 方式 有 较 高 的 效率 ， 并 且 易 于 实现 ， 代 码 的 可 控制 性 较 
好 ， 属 于 单 用 的 模式 。 第 二 种 管道 缓冲 区 不 易 控 制 ， 被 传输 数据 对 象 
不 易于 封装 等 ， 实 用 性 不 强 。 


n 


同步 问题 核心 在 于 : 如 何 保证 同一 资源 被 多 个 线程 并 发 访问 时 的 
完整 性 。 常 用 的 同步 方法 是 采用 信号 或 加 锁 机 制 ， 保 证 资源 在 任意 时 
刻 至 多 被 一 个 线程 访问 。Java 语 言 在 多 线程 编程 上 实现 了 完全 对 象 化 ， 
提供 了 对 同步 机 制 的 恨 好 支持 。 在 Java 中 一 共有 四 种 方法 支持 同步 ， 其 
中 前 三 个 是 同步 方法 ， 一 个 是 管道 方法 。 这 里 我 们 介绍 前 三 个 方法 。 

(1) wait Q /notify () 方法 
(2) await () /signal () 方法 
(3) BlockingQueue 阻 塞 队 列 方 法 

(4)PipedInputStream/PipedOutputStream 

wait () /notify () 方法 

wait () /nofity () 方法 是 基 类 Object 的 两 个 方法 ， 也 就 意味 着 所 
有 Java 类 都 会 拥有 这 两 个 方法 ， 这 样 ， 我 们 就 可 以 为 任何 对 象 实现 同步 
机 制 。 

m wait () Zik: 当 缓冲 区 已 满 / 空 时 ， 生 产 者 /消费 者 线程 停止 自 
己 的 执行 ， 放 弃 锁 ， 使 自己 处 于 等 状态 ， 让 其 他 线程 执行 。 

m notify () 方法 : 当 生 产 者 /消费 者 向 缓冲 区 放 入 /取出 一 个 产品 
时 ， 向 其 他 等 待 的 线程 发 出 可 执行 的 通知 ， 同 时 放弃 锁 ， 使 自己 处 于 
等 待 状态 。 

await () /signal () 方法 

在 JDK5.0 之 后 ，Java 提 供 了 更 加 健壮 的 线程 处 理 机 制 ， 包 括 同步 、 
锁定 、 线 程 池 等 ， 它 们 可 以 实现 更 细 粒 度 的 线程 控制 。await () 和 
signal () 就 是 其 中 用 来 做 同步 的 两 种 方法 ， 它 们 的 功能 基本 上 和 wait 

() /nofity O 相同 ， 完 全 可 以 取代 它们 ， 但 是 它们 和 新 引入 的 锁定 机 
制 Lock 直 接 挂 钩 ， 具 有 更 大 的 灵活 性 。 通 过 在 Lock 对 象 上 调用 
newCondition () 方法 ， 将 条 件 变量 和 一 个 锁 对 象 进 行 绑 定 ， 进 而 控制 
并 发 程序 访问 竞争 资源 的 安全 。 

BlockingQueue 阻 塞 队列 方法 

生产 者 -消费 者 设计 是 围绕 阻塞 队列 展开 的 ， 生 产 者 把 数据 放 入 队 
列 ， 并 使 数据 可 用 ， 当 消费 者 为 适当 的 行为 做 准备 时 会 从 队列 中 获取 
数据 。 生 产 者 不 需要 知道 消费 者 的 省 份 或 者 数量 ， 甚 至 根本 没有 消费 
者 一 它们 只 负责 把 数据 放 入 队列 。 类 似 地 ， 消 费 者 也 不 需要 知道 生产 


者 是 谁 ， 以 及 是 谁 给 它们 安排 的 工作 。BlockingQueue 可 以 使 用 任意 数 
量 的 生产 者 和 消费 者 ， 从 而 简化 了 生产 者 -消费 者 设计 的 实现 。 最 常见 
的 生产 者 -消费 者 设计 是 将 线程 池 与 工作 队列 相 结 合 。 

阻塞 队列 支持 生产 者 -消费 者 设计 模式 。 一 个 生产 者 -消费 者 设计 分 
离 了 “生产 产品 ”和 ?消费 产品 ”。 该 模式 不 会 发 现 一 个 工作 便 立 即 处 理 ， 
而 是 把 工作 置 于 一 个 任务 ("todo") 清单 中 ， 以 备 后 期 处 理 。 生 产 者 - 
消费 者 模式 简化 了 开发 ， 因 为 它 解除 了 生产 者 和 消费 者 之 间 相 互 依赖 
的 代码 。 生 产 者 和 消费 者 以 不 同 的 或 者 变化 的 速度 生产 和 消费 数据 ， 
生产 者 -消费 者 模式 将 这 些 活动 解 厢 ， 因 而 简化 了 工作 负 答 的 管理 。 

阻塞 队列 简化 了 消费 者 的 编码 ， 因 为 程序 代码 会 保持 阻塞 直到 可 
用 数据 出 现 。 如 果 生 产 者 不 能 足够 快 地 产生 工作 ， 让 消费 者 忙碌 起 
来 ， 那 么 消费 者 只 能 一 直 等 待 ， 直 到 有 工作 可 做 。 同 时 ，put 方 法 的 阻 
塞 特性 也 大 大 地 简化 了 生产 者 的 编码 ;， 如 果 使 用 一 个 有 界 队 列 ， 那 么 
当 队 列 充 满 的 时 候 ， 生 产 者 就 会 阻塞 ， 暂 不 能 生成 更 多 的 工作 ， 从 而 
给 消费 者 时 间 来 赶 进度 。 

虽然 生产 者 -消费 者 模式 可 以 把 生产 者 和 消费 者 的 代码 相互 解 耦 
合 ， 但 是 它们 的 行为 还 是 间接 地 通过 共享 队列 耦合 在 一 起 了 。 

类 库 中 包含 一 些 BlockingQueue 的 实现 ， 其 中 LinkedBlockingQueue 
和 ArrayBlockingQueue 是 FIFO 队 列 ， 与 LinkedList 和 ArrayList 相 似 ， 但 
是 却 拥 有 比 同 步 List 更 好 的 并 发 性 能 。PriorityBlockingQueue 是 一 个 按 
优先 级 顺序 排序 的 队列 ， 当 你 不 希望 按照 FIFO 的 属性 处 理 元 素 时 ， 这 
个 PriorityBolckingQueue 是 非常 有 用 的 。 正 如 其 他 排序 的 容器 一 样 ， 
PriorityBlockingQueue 可 以 比较 元 素 本 身 的 自然 顺序 (如 果 它 们 实现 了 
Comparable) ， 也 可 以 使 用 一 个 Comparator 进 行 排序 。 

基于 BlockingQueue 实 现 的 SynchronousQueue， 它 根本 上 不 是 一 个 
真正 的 队列 ， 因 为 它 不 会 为 队列 元 素 维护 任何 存储 空间 。 不 过 ， 它 维 
护 一 个 排队 的 线程 清单 ， 这 些 线 程 等 待 把 元 素 加 入 (enqueue) 队列 或 
者 移出 (dequeue) 队列 。 因 为 SynchronousQueue 没 有 存储 能 力 ， 所 以 
除非 另 一 个 线程 已 经 准备 好 参与 移交 工作 ， 否 则 put 和 take 会 一 直 阻 
止 。SynchronousQueue 这 类 队列 只 有 在 消费 者 充足 的 时 候 比 较 合适 ， 它 
们 总 能 为 下 一 个 任务 做 好 准备 。 关 于 这 方面 知识 ， 我 们 会 在 后 面 详 细 
讲解 。 


生产 者 -消费 者 模式 同样 带 来 了 一 些 性 能 方面 的 提高 。 生 产 者 和 消 
费 者 可 以 并 发 地 执行 ， 如 果 一 个 受 限 于 MO ， 另 一 个 受 限 于 CPU， 那 么 
并 发 执行 的 全 部 产 出 会 高 于 顺序 执行 的 产 出 。 


5.1.8 线程 池 的 使 用 


多 线程 的 软件 设计 方法 确实 可 以 最 大 限度 地 发 挥 现代 多 核 处 理 器 
的 计算 能 力 ， 提 高 生产 系统 的 吞吐 量 和 人 性能。 但是， 和 若 不 加 控制 和 管 
理 地 随意 使 用 线程 ， 对 系统 的 性 能 反而 会 产生 不 利 的 影响 。 

为 了 给 并 行程 序 开发 提供 更 好 的 支持 ，Java 不 仅 提 供 了 Thread 类 、 
Runnable 类 接口 等 简单 的 多 线程 支持 工具 ， 为 了 改善 并 发 程序 性 能 ， 在 
JDK 中 还 提供 了 用 于 多 线程 管理 的 线程 池 。 

第 4 章 已 经 初步 介绍 了 线程 池 概 念 。 从 内 部 实现 上 看 ， 线 程 池 技术 
可 主要 划分 为 工作 者 线程 、 待 处 理 任务 存储 线程 、 线 程 池 初始 化 、 处 
理 业务 任务 算法 、 工 作者 的 增 减 算法 、 线 程 闻 终止 等 6 大 技术 点 。 

m 工作 者 线程 worker: 即 线程 池 中 可 以 重复 利用 起 来 执行 任务 的 
线程 ， 一 个 worker 的 生命 周期 内 会 不 停 的 处 理 多 个 业务 job。 线 程 闻 “ 复 
用 ”的 本 质 就 是 复 用 一 个 worker 去 处 理 多 个 job,“ 流 控 “ 的 本 质 就 是 通过 
worker 数 量 的 控制 实现 并 发 数 的 控制 。 通 过 设置 不 同 的 参数 来 控制 
worker 的 数量 可 以 实现 线程 闻 的 容量 伸缩 从 而 实现 复杂 的 业务 需 3 

m 待 处 理工 作 job 的 存储 队列 : 工作 者 线程 workers 的 数量 是 有 限 
的 ， 同 一 时 间 最 多 只 能 处 理 最 多 workers 数 量 个 job。 对 于 来 不 及 处 理 的 
job 需要 保存 到 等 待 队 列 里 ， 空 内 的 工作 者 work 会 不 停 的 读 取 空 内 队列 
里 的 job 进行 处 理 。 基 于 不 同 的 队列 实现 ， 可 以 扩展 出 多 种 功能 的 线程 
池 ， 如 定制 队列 出 队 顺序 实现 带 处 理 优先 级 的 线程 地、 定制 队列 为 阻 
塞 有 界 队 列 实现 可 阻塞 能 力 的 线程 池 等 。 流 控 一 方面 通过 控制 worker 数 
控制 并 发 数 和 处 理 能 力 ， 一 方面 可 基于 队列 控制 线程 池 处 理 能 力 的 上 
限 。 

m 线程 池 初 始 化 : 即 线程 池 参 数 的 设 定 和 多 个 工作 者 workers 的 初 
始 化 。 通 常 有 一 开始 就 初始 化 指定 数量 的 workers 或 者 有 请 求 时 逐步 初 
始 化 工作 者 两 种 方式 。 前 者 线程 池 启 动 初期 响应 会 比较 快 但 造成 了 空 
载 时 的 少量 性 能 浪费 ， 后 者 是 基于 请 求 量 灵 活 扩容 但 牺牲 了 线程 池 启 
动 初期 性 能 达 不 到 最 优 。 


m 处 理 业务 job 算 法 : 业务 给 线程 池 添 加 任务 job 时 线程 池 的 处 理 算 
法 。 有 的 线程 池 基 于 算法 识别 直接 处 理 job 还 是 增加 工作 者 数 处 理 job 或 
者 放 入 待 处 理 队 列 ， 也 有 的 线程 池 会 直接 将 job 放 入 待 处 理 队 列 ， 等 待 
工作 者 worker 去 取出 执行 。 

m workers 的 增 减 算法 : 业务 线程 数 不 是 持久 不 变 的 ， 有 高 低 峰 
期 。 线 程 池 要 有 自己 的 算法 根据 业务 请 求 频率 高 低调 节 上 自身 工作 者 
workers 的 数量 来 调节 线程 池 大 小 ， 从 而 实现 业务 高 峰 期 增加 工作 者 数 
量 提高 响应 速度 ， 而 业务 低 峰 期 减少 工作 者 数 来 节省 服务 器 资源 。 增 
加 算法 通常 基于 几 个 维度 进行 : 待 处 理工 作 job 数 、 线 程 闻 定义 的 最 大 
最 小 工作 者 数 、 工 作者 闲置 时 间 。 

m 线程 池 终 止 逻辑 : 应 用 停止 时 线程 池 要 有 自身 的 停止 逻辑 ， 保 证 
所 有 job 都 得 到 执行 或 者 抛弃 。 

一 种 最 为 简单 的 线程 创建 和 回收 的 方法 类 似 如 代码 清单 5-20 所 示 。 


代码 清单 5-20 最 简单 的 线程 操作 方法 


new Thread (new Runnable()( 


QOverride 


){ 
//do something 

} 

)).start(); 


以 上 代码 创建 了 一 个 线程 ， 并 在 run O 方法 结束 后 ， 自 动 回收 该 
线程 。 在 简单 的 应 用 系统 中 ， 这 段 代 码 并 没有 太 多 问题 。 但 是 ， 在 真 
实 的 生产 环境 中 ， 系 统 由 于 真实 环境 的 需要 ， 可 能 会 开局 很 多 线程 来 
支撑 其 应 用 。 而 当 线 程 数 量 过 大 时 ， 反 和 而 会 耗 尽 CPU 和 内 存 资源 。 

首先 ， 虽 然 与 进程 相 比 ， 绪 程 是 一 种 轻 量 级 的 工具 ， 但 其 创建 和 
天 闭 依然 需要 化 费时 间 ， 如 果 为 每 一 个 小 的 任务 都 创建 一 个 线程 ， 很 
有 可 能 出 现 创 建 和 销毁 线程 所 占用 的 时 间 大 于 该 线程 真实 工作 所 消耗 
的 时 间 ， 反 而 会 得 不 偿 失 。 

其 次 ， 线 程 本 身 也 是 要 占用 内 存 资源 的 ， 大 量 的 线程 会 抢夺 资 
源 ， 如 果 处 理 不 当 ， 可 能 会 导致 Out of Memory 异常。 即便 没有 ， 大 量 


public void run 


的 线程 回收 也 会 给 GC 寓 来 很 大 的 压力 ， 延 长 GC 的 停顿 时 间 。 

因此 ， 对 线程 使 用 必须 掌握 一 个 度 ， 在 有 限 的 范围 内 ， 增 加 线程 
的 数量 可 以 明显 提高 系统 的 吞吐 量 ， 但 一 旦 超出 了 这 个 范围 ， 大 量 的 
线程 只 会 拖 垮 应 用 系统 。 因 此 ， 在 生产 环境 中 使 用 线程 ， 必 须 对 其 加 
以 控制 和 管理 ， 否 则 讶 目地 大 量 创建 线程 对 系统 性 能 是 有 伤害 的 。 

为 了 节省 系统 在 多 线程 并 发 时 不 断 创建 和 销毁 线程 所 带 来 的 额外 
开销 ， 我 们 需要 引入 线程 闻 。 线 程 闻 的 基本 功能 就 是 进行 线程 的 复 
用 。 当 系统 接受 一 个 提交 的 任务 ， 需 要 一 个 线程 时 ， 并 不 急 着 立即 去 
创建 线程 ， 而 是 先 去 线程 池 碍 找 是 否 有 空余 的 线程 ， 各 有 ， 则 直接 使 
用 线程 闻 中 的 线程 工作 ， 若 没有 ， 再 去 创建 新 的 线程 。 待 任务 完成 
后 ， 也 不 简单 地 销毁 线程 ， 而 是 将 线程 放 入 线程 闻 的 空间 队列 ， 等 待 
下 次 使 用 时 再 次 调用 。 这 样 可 以 在 线程 频繁 调度 的 场合 ， 节 约 不 少 系 
统 开 销 ， 即 创建 和 销毁 线程 的 开销 。 

下 面 的 例子 给 出 一 个 最 为 简单 的 线程 池 实 现 ， 该 实现 不 是 一 个 完 
善 的 线程 池 ， 但 已 经 使 用 最 简单 的 代码 实现 了 一 个 基本 线程 池 的 核心 
功能 ， 有 助 于 读者 快速 理解 线程 地 的 实现 ， 并 创建 自己 的 线程 池 。 

首先 是 线程 闻 的 实现 ， 如 代码 清单 5-21 所 示 。 


代码 清单 5-21 ”线程 池 的 实现 
import java.util.List; 


import java.util.Vector; 


public class ThreadPool { 
private static ThreadPool instance = null; 
// 空 闲 的 线程 队列 
private List<PThread> idleThreads; 
// 已 有 的 线程 总 数 
private int threadCounter; 


private boolean isShutdown - false; 


private ThreadPool () { 
this.idleThreads = new Vector(5); 


threadCounter = 0; 


public int getCreatedThreadsCount () { 


return threadCounter; 


// 取 得 线程 池 的 实例 
public synchronized static ThreadPool getInstance()í 
if(instance == null) { 
instance = new ThreadPool(); 
} 


return instance; 


// 将 线程 放 入 池 中 
protected synchronized void repool(PThread repoolingThread) { 
if (!isShutdown) { 
idleThreads.add(repoolingThread) ; 
Jelse( 


repoolingThread.shutDown(); 


// 停 止 池 中 所 有 线程 


public synchronized void shuwdown () { 


isShutdown = true; 

for(int threadIndex = 0;threadIndex < idleThreads.size();threadIndex++) { 
PThread idleThread = (PThread) idleThreads.get (threadIndex) ; 
idleThread. shutDown () ; 


// 执 行 任务 
public synchronized void start (Runnable target) { 
PThread thread = null; 
// 如 果 有 空闲 线程 ， 则 直接 使 用 
if (idleThreads.size()>0) { 
int lastIndex = idleThreads.size() - 1; 
thread = (PThread) idleThreads.get (lastIndex) ; 
idleThreads. remove (lastIndex) ; 
// 立 即 执行 这 个 任务 
thread.setTarget (target) ; 
Jelse( 
// 没 有 空闲 线程 
threadCountertt; 
thread = new PThread(target,"PThread #"+threadCounter, this); 
/ /启动 这 个 线程 
thread.start () ; 


} 


要 使 用 上 述 线程 闻 ， 需 要 一 个 永 不 退出 的 线程 与 之 配合 。PThread 
就 是 这 样 一 个 线程 ， 它 的 线程 主体 部 分 是 一 个 无 限 循环 ， 该 线程 在 手 
动 关闭 前 永 不 结束 ， 并 一 直 等 竺 新 的 任务 达到 。 代 码 如 代码 清单 5-22 所 
示 。 


代码 清单 5-22 线程 守护 示例 
public class PThread extends Thread{ 
// 线 程 池 

private ThreadPool pool; 

// 任 务 

private Runnable target; 

private boolean isShutdown = false; 

private boolean isIdle - false; 

/ DW AE 

public PThread(Runnable target,String name,ThreadPool pool) { 
super (name) ; 
this.pool = pool; 
this.target = target; 


public Runnable getTarget () ( 


return target; 


public boolean isIdle() { 


return isIdle; 


public void run() { 
// 只 要 没有 关闭 ， 则 一 直 不 结束 该 线程 
while(!isShutdown)( 

isIdle - false; 

if(target != null)( 
// 运 行 任务 
target.run(); 

} 

// 任 务 结束 了 ， 到 闲置 状态 

isIdle = true; 

try{ 
// 该 任务 结束 后 ， 不 关闭 线程 ， 而 是 放 入 线程 池 空闲 队列 
pool.repool (this); 
synchronized (this){ 

// 线 程 室 闲 ， 等 待 新 的 任务 到 来 
wait(); 

} 

)catch(InterruptedException ex) { 
ex.printStackTrace () ; 

} 


isIdle = false; 


public synchronized void setTarget (java.lang.Runnable newTarget) { 
target = newTarget; 
// 设 置 了 任务 之 后 ， 通 知 run 方法 ， 开 始 执行 这 个 任务 
notifyAll(); 


// 关 闭 线程 

public synchronized void ShutDown (){ 
isShutDown = true; 
notifyAll(); 


使 用 线程 地 后 ， 绪 程 的 创建 和 关闭 通常 由 线程 池 维护 。 线 程 通 单 
不 会 因为 执行 完 一 次 任务 而 被 关闭 ， 线 程 池 中 的 线程 会 被 多 个 任务 重 
复 使 用 。 

首先 定义 一 个 线程 类 ， 作 为 任务 对 象 ， 如 代码 清单 5-23 所 示 。 


代码 清单 5-23 定义 一 个 线程 类 
public class MyThread implements Runnable{ 


protected String name; 


public MyThread () { 


public MyThread (String name) { 


this.name = name; 


@Override 
public void run() { 
// TODO Auto-generated method stub 
try{ 
Thread. sleep (1000) ; 
}catch (InterruptedException ex) { 


ex. printStackTrace(); 


} 


我 们 尝试 创建 10 万 个 线程 ， 采 用 不 用 线程 闻 和 使 用 线程 闻 两 种 不 
同 的 方法 ， 代 码 如 代码 清单 5-24 所 示 。 


代码 清单 5-24 ”两 种 不 同方 法 创建 线程 
public class TestMyThread { 
public static void main(String[] args) { 
long start = System.currentTimeMillis(); 
for(int i=0;i<100000;i++){ 
new Thread (new MyThread ("testNoThreadPool"*Integer.toString (i))).start (); 
} 


System.out.println(System.currentTimeMillis() - start); 


start = System.currentTimeMillis(); 
for(int i=0;1<100000; i++) { 
ThreadPool.getInstance() .start (new 
MyThread ("testNoThreadPool"+Integer.toString(i))); 
} 


System.out.println(System.currentTimeMillis() - start); 


} 


输出 结果 分 别 为 2465ms 和 734ms， 结 果 表 明 ， 为 实现 线程 池 的 调 
度 ， 花 费时 间 较 长 。 在 未 使 用 线程 池 的 实现 中 ， 实 际 产生 线程 数量 10 
万 个 ， 但 在 使 用 线程 池 的 实现 中 ， 由 于 任务 一 边 被 调度 ， 一 边 被 执 
行 ， 在 整个 任务 调度 过 程 中 ， 有 部 分 线程 因为 执行 完毕 ， 被 重新 返回 
线程 池内 ， 所 以 这 些 线程 被 复 用 ， 实 际 产生 的 线程 数量 小 于 10 万 个 。 
由 此 可 见 ， 在 线程 频繁 被 调度 时 ， 复 用 线程 ， 对 提高 系统 性 能 非常 有 
帮助 。 

我 们 来 考虑 一 个 具体 的 实例 。 对 于 服务 端的 程序 ， 经 常 面 对 的 是 
客户 端 传 入 的 短小 (执行 时 间 短 、 工 作 内 容 较为 单一 ) 任务， 需要 服 
务 端 快速 处 理 并 返回 结果 。 如 果 服 务 端 每 次 接受 到 一 个 任务 ， 创 建 一 
个 线程 ， 然 后 进行 执行 ， 这 在 原型 阶段 是 个 不 错 的 选择 ， 但 是 面 对 成 
千 上 万 的 任务 递交 进 服务 器 时 ， 如 果 还 是 采用 一 个 任务 一 个 线程 的 方 
式 ， 那 么 将 会 创建 数 以 万 计 的 线程 ， 这 不 是 一 个 好 的 选择 。 因 为 这 会 


使 操作 系统 频繁 的 进行 线程 上 下 文 切换 ， 无 故 增加 系统 的 负载 ， 而 线 
程 的 创建 和 消亡 都 是 需要 消耗 系统 资源 的 ， 也 无 疑 瀛 费 了 系统 资源 。 

线程 闻 技 术 能 够 很 好 解决 这 个 间 题 ， 它 预先 创建 了 若干 数量 的 线 
程 ， 并 且 不 能 由 用 户 直 接 对 线程 的 创建 进行 控制 ， 在 这 个 前 提 下 重复 
使 用 固定 或 较为 固定 数目 的 线程 来 完成 任务 的 执行 。 这 样 做 的 好 处 
是 ， 一 方面 ， 消 除了 频繁 创建 和 消亡 线程 的 系统 资源 开销 ， 另 一 方 
面 ， 面 对 过 量 任务 的 提交 能 够 平缓 的 劣化 。 

为 了 能 够 更 好 地 控制 多 线程 ，JDK 提 供 了 一 套 Exectuor 框 架 ， 帮 助 
开发 人 员 有 效 地 进行 线程 控制 。 框 架 为 了 java.util.concurrent 包 中 ， 是 
JDK 开 发 包 的 核心 类 。 其 中 ThreadPoolExecutor 表 示 一 个 线程 池 ， 当 然 
它 的 实现 比 上 文中 的 ThreadPool 复 杂 许 多 。Executors 类 则 扮演 者 线程 闻 
工厂 的 角色 ， 通 过 Executors 可 以 取得 一 个 特定 功能 的 线程 池 。 
ThreadPoolExecutor 类 实现 了 Executor 接 口 ， 因 此 通过 这 个 接口 ， 任 何 
Runnable 的 对 象 都 可 以 被 ThreadPoolExecutor 调 度 。 

注意 ， 如 果 没 有 特殊 要 求 ， 可 以 直接 使 用 JDK 中 的 内 置 线程 池 来 改 
善 系统 的 性 能 。 

线程 池 的 大 小 对 系统 的 性 能 有 一 定 的 影响 。 过 大 或 者 过 小 的 线程 
数量 都 无 法 发 挥 最 优 的 系统 性 能 ， 但 是 线程 闻 大 小 的 确定 也 不 需要 做 
得 非常 精确 ， 因 为 只 要 避免 极 大 和 极 小 的 两 个 极端 情况 发 生 就 可 以 
了 ， 线 程 闻 的 大 小 对 系统 的 性 能 并 不 会 影响 太 大 。 一 般 来 说 ， 确 定 线 
程 池 的 大 小 需要 考虑 CPU 数量 、 内 存 大 小 、JDBC 连 接 等 诸多 因素 。 一 
个 估算 线程 池 大 小 的 经 验 公式 : 

Ncpu=CPU 的 数量 

Ucpu= 目 标 CPU 的 使 用 率 ，Ucpu 的 值 在 0-1 之 间 

W/C= 等 待 时 间 与 计算 时 间 的 比率 

为 保持 处 理 器 达到 期 望 的 使 用 率 ， 最 优 的 线程 闻 的 大 小 等 于 
Nthreads=Ncpu*Ucpu* (1+W/C) 。 


5.2 锁 机 制 对 比 
5.2.1 锁 机 制 概述 


锁 是 用 来 控制 多 个 线程 访问 共享 资源 的 方式 。 一 般 来 说 ， 一 个 锁 
能 够 防止 多 个 线程 同时 访问 共享 资源 〈 但 是 有 些 锁 可 以 允许 多 个 线程 
并 发 的 访问 共享 资源 ， 例 如 读 写 锁 ) 。 在 Lock 接 口 出 现 之 前 ，Java 程 序 
是 靠 synchronized 关 键 字 实 现 锁 功 能 的 ， 而 Java5 之 后 ， 并 发 包 中 新 增 了 
Lock 接 口 用 来 实现 锁 功能 ， 它 提供 了 与 synchronized 关 键 字 类 似 的 同步 
功能 ， 只 是 在 使 用 时 需要 显 式 地 获取 和 释放 锁 。 虽 然 它 却 少 了 (通过 
synchronized 块 或 者 方法 所 提供 的 ) 隐 式 获取 释放 锁 的 便捷 性 ， 但 是 却 
拥有 了 锁 获 取 与 释放 的 可 操作 性 、 可 中 断 的 获取 锁 以 及 超时 获取 锁 等 
多 种 synchronized 关 键 字 所 不 具备 的 同步 特性 。 

使 用 synchronized 关 键 字 将 会 隐 式 地 获取 锁 ， 但 是 它 将 锁 的 获取 和 
释放 固化 了 ， 也 就 是 先 获 取 再 释放 。 当 然 ， 这 种 方式 简化 了 同步 的 管 
理 ， 可 是 扩展 性 没有 显示 的 锁 获 取 和 释放 来 得 好 。 举 一 个 例子 ， 针 对 
一 个 场景 ， 我 们 手把手 地 进行 锁 获 取 和 释放 ， 先 获得 锁 A， 然 后 再 释放 
锁 B， 当 锁 B 获 得 后 ， 释 放 锁 A 同 时 获取 锁 C， 当 锁 C 获 得 后 ， 再 释放 锁 
B 同 时 获取 锁 D， 以 此 类 推 。 这 种 场景 下 ，synchronized 关 键 字 就 不 那么 
容易 实现 了 ， 而 使 用 Lock 却 容易 许多 。 

Lock 的 使 用 很 简单 ， 如 下 面 代 码 所 示 ， 后 续 章节 会 详细 介绍 各 种 
Lock 锁 的 实现 类 。 


代码 清单 5-25 Lock 锁 基本 实现 
Lock lock = new ReentrantLock(); 
lock.lock(); 
try{ 
}finally{ 
lock.unlock(); 


} 


在 finally 块 中 释放 锁 ， 目 的 是 保证 在 获取 到 锁 之 后 ， 最 终 能 够 被 释 
放 。 注 意 ， 不 要 把 获取 锁 的 过 程 写 在 try 块 中 ， 因 为 如 果 在 获取 锁 (B 
定义 锁 的 实现 ) 时 发 生 了 异常 ， 异 常 抛 出 的 同时 也 会 导致 锁 无 故 释 
放 。 

相 比 较 synchronized 关 键 字 而 言 ，Lock 锁 有 如 下 一 些 特点 。 


(1) 尝试 非 阻 塞 地 获取 锁 : 当前 线程 尝试 获取 锁 ， 如 果 这 一 时 刻 
没有 被 其 他 线程 获取 到 ， 则 同时 获取 并 持 有 锁 ; 

(2) 能 被 中 断 地 获取 锁 : 与 synchronized 关 键 字 不 同 ， 获 取 到 锁 的 
线程 能 够 响应 终端 ， 当 获取 到 锁 的 线程 被 中 断 时 ， 中 断 异 常 将 会 被 抛 
出 ， 同 时 锁 会 被 释放 ; 

(3) 超时 获取 锁 : 在 制定 的 截止 时 间 之 前 获取 锁 ， 如 果 截 止 时 间 
到 了 仍然 无 法 获取 锁 ， 则 返回 。 

业务 逻辑 的 实现 过 程 中 ， 往 往 需要 保证 数据 访问 的 排他 性 。 如 在 
金融 系统 的 日 终结 算 处 理 中 ， 我 们 希望 针对 某 个 cut-off 时 间 点 的 数据 进 
行 处 理 ， 而 不 希望 在 结算 进行 过 程 中 〈 可 能 是 几 秒 ， 也 可 能 是 几 个 小 
时 ) ， 数 据 再 发 生变 化 。 此 时 ， 我 们 就 需要 通过 一 些 机 制 来 保证 这 些 
数据 在 某 个 操作 过 程 中 不 会 被 外 界 修改 ， 这 样 的 机 制 ， 也 就 是 所 谓 的 
“ 锁 ”， 给 我 们 选 定 的 目标 数据 上 锁 ， 使 其 无 法 被 其 他 程序 修改 。 

ARNEL (Pessimistic Locking) ， 正 如 其 名 ， 它 指 的 是 对 数据 被 外 
A (包括 本 系统 当前 的 其 他 事务 ， 以 及 来 自 外 部 系统 的 事务 处 理 ) 修 
改 持 保守 态度 。 因 此 ， 在 整个 数据 处 理 过 程 中 ， 将 数据 处 于 锁定 状 
态 。 悲 观 锁 的 实现 ， 往 往 依 靠 数据 库 提供 的 锁 机 制 (也 只 有 数据 库 层 
提供 的 锁 机 制 才能 真正 保证 数据 访问 的 排他 性 ， 否 则 ， 即 使 在 本 系统 
中 实现 了 加 锁 机 制 ， 也 无 法 保证 外 部 系统 不 会 修改 数据 ) 。 

乐观 锁 (Optimistic Locking) ， 相 对 悲观 锁 而 言 ， 乐 观 锁 机 制 采 取 
了 更 加 宽松 的 加 锁 机 制 。 悲 观 锁 大 多 数 情况 下 依靠 数据 库 的 锁 机 制 实 
现 ， 以 保证 操作 最 大 程度 的 独占 性 。 但 随 之 而 来 的 就 是 数据 库 性 能 的 
大 量 开 销 ， 特 别 是 对 长 事务 而 言 ， 这 样 的 开销 往往 无 法 承受 。 如 一 个 
金融 系统 ， 当 某 个 操作 员 读 取 用 户 的 数据 ， 并 在 读 出 的 用 户 数据 的 基 
础 上 进行 修改 时 (如 更 改 用 户 账户 余额 ) ， 如 果 采 用 悲观 锁 机 制 ， 也 
就 意味 着 整个 操作 过 程 中 (从 操作 员 读 出 数据 、 开 始 修 改 直 至 提交 修 
改 结果 的 全 过 程 ， 甚 至 还 包括 操作 员 中 途 去 者 咖啡 的 时 间 ) ， 数 据 库 
记录 始终 处 于 加 锁 状 态 ， 可 以 想见 ， 如 果 面 对 几 百 上 干 个 并 发 ， 这 样 
的 情况 将 导致 怎样 的 后 果 。 


5.2.2 Synchronized 使 用 技巧 


关键 字 synchronized 拥 有 可 重 入 锁 的 功能 ， 也 就 是 在 使 用 
synchronized 时 ， 当 一 个 线程 得 到 一 个 对 象 锁 后 ， 再 次 请 求 此 对 象 锁 时 
是 可 以 再 次 得 到 该 对 象 的 锁 的 。 这 也 证 明 在 一 个 synchronized 方 法 / 块 的 
内 部 调用 本 类 的 其 他 synchronized 方 法 / 块 时 ， 是 永远 可 以 得 到 锁 的 。 
synchronized 用 的 锁 是 存在 Java 对 象 头 里 的 。 如 果 对 象 是 数组 类 型 ， 则 
虚拟 机 用 3 个 字 宽 存储 对 象 头 ， 如 果 对 象 是 非 数 组 类 型 ， 则 用 2 个 字 宽 
存储 对 象 头 。 在 32 位 虚拟 机 中 ，1 字 宽 等 于 4 字 节 ， 即 32Bit。 

我 们 首先 来 看 一 个 Synchronized 示 例 ， 如 代码 清单 5-26 所 示 。 


代码 清单 5-26 Synchronized 示例 
public class MyObject { 
public void methodA() { 

try{ 

System.out.println("begin methodA threadName=" 
+Thread.currentThread() .getName()) ; 

Thread.sleep (500) ; 
System.out.println ("end"); 

)catch (InterruptedException ex) { 


ex.printStackTrace(); 


public class ThreadA extends Thread{ 

private MyObject object; 

public ThreadA(MyObject object) { 
super (); 
this.object = object; 

} 

@Override 

public void run() { 
super.run(); 


object.methoda () ; 


public class ThreadB extends Thread{ 
private MyObject object; 
public ThreadB(MyObject object) { 


super (); 


this.object = object; 
} 
@Override 
public void run() { 
super.run(); 


object.methodA () ; 


public class runClass { 
public static void main(String[] args) { 

MyObject object = new MyObject() ; 
ThreadA a = new ThreadA(object); 
a.setName ("A") ; 

ThreadB b = new ThreadB (object); 
b.setName ("B"); 

a.start() ; 

b.start(); 


} 


如 果 有 具体 执行 类 MyObject 的 methodA 方 法 不 加 上 关键 字 
synchronized， 那 么 输出 如 代码 清单 5-27 所 示 。 


代码 清单 5-27 运行 输出 1 
begin methodA threadName-B 
begin methodA threadName-A 
end 


end 


如 果 加 上 关键 字 synchronized， 输 出 会 如 清单 5-28 所 示 。 


代码 清单 5-28 运行 输出 2 
begin methodA threadName-A 
end 
begin methodA threadName-B 


end 


通过 下 面 的 实例 我 们 可 以 看 到 ， 调 用 关键 字 synchronized 声 明 的 方 
法 一 定 是 排队 运行 的 。 另 外 只 有 共享 资产 的 读 写 访问 才 需 要 同步 化 ， 
如 果 不 是 共享 资源 ， 那 么 根本 就 没有 同步 的 必要 。 

我 们 知道 ， 关 键 字 synchronized 取 得 的 锁 都 是 对 象 锁 ， 而 不 是 把 一 
段 代码 或 方法 (eR) 当 作 锁 ， 所 以 在 下 面 的 示例 中 ， 哪 个 线程 先 执 
行 带 synchronized 关 键 字 的 方法 ， 哪 个 线程 就 持 有 该 方法 所 属 对 象 的 锁 
Lock， 那 么 其 他 线程 只 能 呈 等 待 状态 ， 前 提 是 多 个 线程 访问 的 是 同一 
个 对 象 。 

但 如 果 多 个 线程 访问 多 个 对 象 ， 则 JVM 会 创建 多 个 锁 ， 下 面 的 示 
例 就 是 创建 了 2 个 sychrnoziedFunc.java 类 的 对 象 ， 所 以 就 产生 了 2 个 锁 。 


代码 清单 5-29 创建 多 个 锁 示 例 
public class sychrnoziedFunc { 
private int num - 0; 
// 同 步 方 法 ， 说 明 此 方法 应 该 被 顺序 调用 
synchronized public void addI(String username) { 
try{ 
if (username.equals ("a") ) { 
num = 100; 
System.out.println("a set over"); 
Thread.sleep (12000); 
Jelse( 
num = 200; 
System.out.println("b set over"); 
} 
System.out.println(username + "num=" + num); 
}catch (Exception ex) { 
ex.printStackTrace();//TODO auto-generated catch block 


} 
public class sychrnoziedFuncRun { 
public static void main(String[] args) { 

sychrnoziedFunc numRefl = new sychrnoziedFunc(); 
sychrnoziedFunc numRef2 - new sychrnoziedFunc(); 
ThreadA athread = new ThreadA(numRef1) ; 
athread.start(); 
ThreadB bthread = new ThreadB (numRef1); 
bthread.start(); 


) 
public class ThreadA extends Thread{ 


private sychrnoziedFunc numRef; 


public ThreadA(sychrnoziedFunc numRef) { 
super(); 
this.numRef = numRef; 


GOverride 

public void run() { 
super.run(); 
numRef.addI ("a"); 


} 
public class ThreadB extends Thread{ 


private sychrnoziedFunc numRef; 


public ThreadB(sychrnoziedFunc numRef) { 


super () ; 
this.numRef - numRef; 


} 


QOverride 
public void run() { 
super.run(); 


numRef.addI("b") ; 


} 


运行 输出 如 清单 5-30 所 示 。 


代码 清单 5-30 代码 5-29 运行 输出 
a set over 
anum-100 
b set over 
bnum-200 


上 面 代 码 中 两 个 线程 分 别 访问 以 同一 个 类 的 两 个 不 同 实例 的 相同 
名 称 的 同步 方法 。 

里 然 synchronized 功 能 强大 ， 但 是 使 用 关键 字 synchronized 声 明 方 法 
在 某 些 情况 下 是 有 弊端 的 ， 比 如 线程 A 调 用 同步 方法 执行 一 个 长 时 间 任 
务 ， 那 么 B 线 程 则 必须 等 待 比较 长 时 间 。 在 这 样 的 情况 下 可 以 使 用 
synchronized 同 步 语 句 块 来 解决 。 当 两 个 并 发 线程 访问 同一 个 对 象 object 
中 的 synchronized (this) 同步 代码 块 时 ， 一 段 时 间 内 只 能 有 一 个 线程 被 
执行 ， 另 一 个 线程 必须 等 待 当前 线程 执行 完 这 个 代码 块 以 后 才能 执行 
该 代码 块 。 


代码 清单 5-31 ”对象 等 待 示例 
public class ObjectService { 
public void serviceMethod () { 
tryl 
synchronized (this) { 
System.out.println("begin time="+System.currentTimeMillis()); 
Thread.sleep (2000); 
System.out.println("end time="+System.currentTimeMillis()); 
} 
}catch (InterruptedException e) { 


e.printStackTrace(); 


public class ThreadA extends Thread{ 
private ObjectService service; 
public ThreadA(ObjectService service) { 
super () ; 


this.service = service; 


} 
@Override 
public void run() { 


service.serviceMethod(); 


public class ThreadB extends Thread{ 

private ObjectService service; 

public ThreadB(ObjectService service) { 
super () ; 
this.service = service; 

} 

@Override 

public void run() { 


service. serviceMethod (); 


public class runClass { 
public static void main(String[] args) { 

ObjectService service = new ObjectService(); 
ThreadA a = new ThreadA(service); 
a.setName ("a") ; 
a.start (); 
ThreadB b = new ThreadB(service); 
b.setName ("b") ; 
b.start(); 


上 面 的 实验 中 虽然 使 用 了 synchronized 同 步 代 码 块 ， 但 执行 的 效率 

还 是 没有 提高 ， 执 行 的 效果 还 是 同步 运行 的 。 在 使 用 同步 synchronized 

(this) 代码 块 时 需要 注意 的 是 ， 当 一 个 线程 访问 object 的 一 个 
synchronized (this) 同步 代码 块 时 ， 其 他 线程 对 同一 个 object 中 所 有 其 
他 synchronized (this) 同步 代码 块 的 访问 将 被 阻塞 ， 这 说 明 
synchronized 使 用 的 是 一 个 对 象 监 视 器 ， 锁 定 了 当前 对 象 。 

类 似 于 synchronized 机 制 ，JVM 基 于 进入 和 退出 Monitor 对 象 来 实现 
方法 同步 和 代码 块 同 步 。 代 码 块 同步 是 使 用 monitorenter 和 monitorexit 指 
令 实 现 的 。monitorenter 指 令 是 在 编译 后 插入 到 同步 代码 块 的 开始 位 
置 ， 而 monitorexit 指 令 是 插入 到 方法 结束 处 和 异常 处 ，JVM 要 保证 每 个 
monitorenter 必须 有 对 应 的 monitorexit 与 之 配对 。 任 何 对 象 都 有 一 个 
monitor 与 之 关联 ， 如 果 一 个 monitor 被 持 有 后 ， 它 将 处 于 锁定 状态 。 线 
程 执行 到 monitorenter 指 令 时 ， 将 会 尝试 获取 对 象 所 对 应 的 monitor 的 所 
有 权 ， 即 尝试 获得 对 象 的 锁 。 


5.2.3 Volatile 的 使 用 技巧 


Java 对 象 中 声明 为 volatile 的 字段 常用 于 线程 之 间 状 态 信息 的 同步 ， 
即 线程 从 对 象 中 读 取 的 volatile 字 段 值 就 是 上 次 写 入 该 volatile 变 量 中 的 
值 ， 不 论 该 线程 正在 读 还 是 写 ， 也 不 论 这 些 线程 在 什么 地 方 运行 ， 它 
们 可 以 在 不 同 的 CPU 插 模 上 ， 即 不 同 的 CPU Socket 上 ,或 者 在 不 同 的 
CPU 核 上 。 使 用 volatile 也 会 带 来 一 些 副 作用 ， 它 会 限制 现代 JVM 的 JIT 
编译 器 对 这 个 字段 的 优化 ， 比 如 volatile 字 段 必须 遵守 一 定 的 指令 规 
则 。 

简 而 言 之 ，volatile 字 段 值 在 应 用 程序 的 所 有 线程 和 和 CPU 缓存 中 必 
须 保持 同步 。 例 如 ， 存 放 在 CPU 缓存 中 的 volatile 字 段 值 被 一 个 线程 修 
改 后 ， 存 有 该 volatile 变 量 原 始 值 在 其 他 CPU 的 缓存 中 的 县 城 ， 在 线程 
读 取 本 地 CPU 缓存 中 volatile 字 段 之 前 必须 对 其 更 新 ， 否 则 就 只 能 强制 
制定 从 内 存 中 读 取 更 新 过 的 volatile 字 段 值 。 为 了 确保 CPU 缓存 及 时 更 
新 ， 即 在 各 个 线程 之 间 保 持 同步 ， 出 现 volatile 字 段 的 地 方 都 会 加 入 一 
条 CPU 指 令 ， 即 内 存 屏 障 ， 通 常 称 为 membar 或 fence， 一 旦 volatile 字 段 
值 发 生变 化 就 会 触发 CPU 缓存 更 新 。 


对 一 个 拥有 多 CPU 缓存 ， 性 能 要 求 很 高 的 应 用 程序 ， 频 繁 更 新 
volatile 字 段 可 能 导致 性 能 问题 。 然 而 ， 实 际 上 很 少 会 有 Java 应 用 程序 依 
赖 频 繁 更 新 的 volatile 字 段 ， 但 是 总 有 一 些 例 外 发 生 。 如 果 你 留意 一 
点 ， 即 频繁 更 新 、 改 变 或 写 入 volatile 字 段 有 可 能 导致 性 能 问题 OREX 
volatile 字 段 不 会 造成 性 能 问题 ) ， 就 不 太 容 易 碰 到 这 类 问题 了 。 

如 果 你 观察 到 volatile 字 段 上 存在 大 量 的 CPU 高 速 缓存 未 命中 并 且 
分 析 源 码 后 发 现 对 volatile 字 段 频繁 的 写 操作 ， 基 本 可 以 断定 应 用 程序 
的 性 能 问题 源 于 不 恰当 地 使 用 了 volatile 变 量 。 这 种 情况 的 解决 方案 是 
尽量 减少 对 volatile 变 量 的 写 操作 ， 或 者 对 应 用 程序 进行 重 构 避 免 使 用 
volatile 字 段 。 不 要 直接 删除 volatile 字 段 ， 这 可 能 会 破坏 程序 的 正确 性 
或 引入 潜在 的 竞争 条 件 。 一 个 性 能 稍 差 的 应 用 程序 比 一 个 错误 的 实现 
或 有 潜在 竞争 问题 的 程序 要 好 得 多 。 

volatile 是 轻 量 级 的 synchronized， 它 在 多 处 理 器 开发 中 保证 了 共享 
变量 的 “可 见 性 *。 可 见 性 的 意思 是 当 一 个 线程 修改 一 个 共享 变量 时 ， 
另外 一 个 线程 能 读 到 这 个 修改 的 值 ， 即 如 果 一 个 字段 被 声明 为 
volatile，Java 线 程 内 存 模 型 确保 所 有 线程 看 到 这 个 变量 的 值 是 一 致 的 。 
如 果 volatile 变 量 修饰 符 使 用 恰当 的 话 ， 它 比 synchronized 的 使 用 和 执行 
成 本 更 低 ， 因 为 它 不 会 引起 线程 上 下 文 的 切换 和 调度 。 

前 面 了 解 了 这 么 多 基础 知识 ， 那 么 Volatile 是 如 何 来 保证 可 见 性 的 
呢 ? 

为 了 提高 处 理 速 度 ， 处 理 器 不 会 直接 和 内 存 进行 通信 ， 而 是 先 将 
系统 内 存 的 数据 读 到 内 存 缓存 (L1、L2 或 其 他 ) 后 再 进行 操作 ， 但 操 
作 完 不 知道 何 时 会 写 回 内 存 。 如 果 对 声明 了 volatile 的 变量 进行 写 操 
作 ，JVM 就 会 向 处 理 器 发 送 一 条 Lock 前 缀 的 指令 ， 将 这 个 变量 所 在 缓 
存 行 的 数据 写 回 到 系统 内 存 。 但 是 ， 就 算 写 回 到 内 存 ， 如 果 其 他 处 理 
器 缓存 的 值 还 是 上 日 的 ， 再 执行 计算 操作 就 会 有 问题 。 所 以 ， 在 多 处 理 
器 下 ， 为 了 保证 各 个 处 理 器 的 缓存 是 一 致 的， 就 会 实现 缓存 一 致 性 协 
议 ， 每 个 处 理 器 通过 嗅 探 在 总 线 上 传播 的 数据 来 检查 自己 缓存 的 值 是 
不 是 过 期 了 ， 当 处 理 器 发 现 自己 缓存 行 对 应 的 内 存 地址 被 修改 ， 就 会 
将 当前 处 理 器 的 缓存 行 设置 或 无 效 状 态 ， 当 处 理 器 对 这 个 数据 进行 修 
改 操 作 的 时 候 ， 会 重新 从 系统 内 存 中 把 数据 读 到 处 理 器 缓存 里 。 


底层 汇编 代码 会 针对 Volatile 关 键 字 修饰 的 变量 添加 Lock 前 缀 的 指 
令 ， 该 指令 在 多 核 处 理 器 下 会 做 两 件 事情 : 

(1) 将 当前 处 理 器 缓存 行 的 数据 写 回 到 系统 内 存 。Lock 前 缀 指令 
导致 在 执行 指令 期 间 ， 声 言 处 理 器 的 LOCK# 信 号 。 在 多 处 理 器 环境 
中 ，LOCK# 信 号 确保 在 声言 该 信号 期 间 ， 处 理 器 可 以 独占 任何 共享 内 


存 。 但 是 ， 再 最 近 的 处 理 器 里 ，LOCK## 信 号 一 般 不 锁 总 线 ， 而 是 锁 缓 
存 ， 毕 竟 锁 总 线 开 销 比较 大 。 


(2) 这 个 写 回 内 存 的 操作 会 使 在 其 他 CPU 里 缓存 了 该 内 存 地 址 的 
数据 无 效 。 在 多 核 处 理 器 系统 中 进行 操作 的 时 候 ，IA-32 和 Intel64 处 理 
器 能 嗅 探 其 他 处 理 器 访问 系统 内 存 和 它们 的 内 存 缓存 。 处 理 器 使 用 嗅 
探 技 术 保证 它 的 内 部 缓存 、 系 统 内 存 和 其 他 处 理 器 的 缓存 的 数据 在 总 
线 上 保持 一 致 。 


5.2.4 队列 同步 器 


队列 同步 器 (AbstractQueuedSynchronizer) ， 是 用 来 构建 锁 或 者 其 
他 同步 组 件 的 基础 框架 ， 它 使 用 了 一 个 int 成 员 变 量 表示 同时 状态 ， 通 
过 内 置 的 FIFO 队 列 来 完成 资源 获取 线程 的 排队 工作 ， 它 是 实现 大 部 分 
同步 需求 的 基础 。 

队列 同步 器 的 主要 使 用 方式 是 继承 ， 子 类 通过 继承 同步 器 并 实现 
它 的 抽象 方法 来 管理 同步 状态 ， 在 抽象 方法 的 实现 过 程 中 免不了 要 对 
同步 状态 进行 更 改 ， 这 时 就 需要 使 用 同步 器 提供 的 3 个 方法 ，getState 
() ~、setState (int newState) 和 compareAndSetState (int expect, int 
update) 来 进行 操作 ， 因 为 它们 能 够 保证 状态 的 改变 是 安全 的 。 子 类 推 
荐 被 定义 为 自 定 义 同步 组 件 的 静态 内 部 类 ， 同 步 器 自身 没有 实现 任何 
同步 接口 ， 它 仅仅 是 定义 了 若干 同步 状态 获取 和 释放 的 方法 来 供 自 定 
义 同步 组 件 使 用 ， 同 步 器 既 可 以 支持 独占 式 地 获取 同步 状态 ， 也 可 以 
支持 共享 式 地 获取 同步 状态 ， 这 样 就 可 以 方便 实现 不 同类 型 的 同步 组 
{F 〈ReentrantLock、ReetrantReadWriteLock 和 CountDownLatch 等 ) o 

锁 是 面向 使 用 者 而 言 的 ， 它 一 定 了 使 用 者 与 锁 交 互 的 借口 ， 比 如 
可 以 允许 两 个 线程 并 行 访问 ， 隐 藏 了 实现 的 细节 。 同 步 器 面向 的 是 锁 
的 实现 者 ， 它 简化 了 锁 的 实现 方式 ， 屏 数 了 同步 状态 管理 、 线 程 的 排 


队 、 等 待 与 唤醒 等 底层 操作 。 总 的 来 说 ， 锁 和 同步 器 很 好 地 隔离 了 使 
用 者 和 实现 者 所 需 关 注 的 领域 。 

队列 同步 器 的 设计 是 基于 模板 方法 模式 的 ， 也 就 是 说 ， 使 用 者 需 
要 继承 队列 同步 器 并 重 写 制定 的 方法 ， 随 后 将 队列 同步 器 组 合 在 自 定 
义 同 步 组 件 的 实现 中 ， 并 调用 同步 器 提供 的 模板 方法 ， 而 这 些 模板 方 
法 将 会 调用 使 用 者 重 写 的 方法 。 重 写 同步 器 指定 的 方法 时 ， 需 要 使 用 
同步 器 提供 的 3 个 方法 ，getState () 、 setState (int newState) 和 
compareAndSetState (int expect，int update) 来 访问 或 者 修改 同步 状 
太 


队列 同步 器 可 重 写 的 方法 有 以 下 这 些 : 

(1) tryAcquire: 独占 式 获 取 同 步 状态 ， 实 现 该 方法 需要 查询 当前 
状态 并 判断 同步 状态 是 否 符合 预期 ， 然 后 再 进行 CAS 设 置 同步 状 态 。 

(2) tryRelase: 独占 式 释 放 同 步 状 态 ， 等 待 获 取 同 步 状 态 的 线程 
有 机 会 获取 同步 状态 。 

(3) tryAcquireShared: 共享 式 获 取 同 步 状态 ， 返 回 大 于 等 于 0 的 
值 ， 表 示 获 取 成 功 ， 反 之 获取 失败 。 

(4) tryReleaseShared: 共享 式 释放 同步 状态 。 

(5) 当前 同步 器 是 否 在 独占 模式 下 被 线程 占用 ， 一 般 该 方法 表示 
是 否 被 当前 线程 所 独占 。 实 现 自 定义 同步 组 件 时 ， 将 会 调用 同步 器 提 
供 的 模板 方法 ， 这 些 模板 方法 包括 以 下 这 些 : 

(1) acquire: 独占 式 获取 同步 状态 ， 如 果 当 前 线程 获取 同步 状态 
成 功 ， 则 由 该 方法 返回 ， 否 则 ， 将 会 进入 同步 队列 等 待 ， 该 方法 将 会 
调用 重 写 的 tryAcquire 方 法 。 

(2) acquireInterruptibly: 与 acquire 方 法 相同 ， 但 是 该 方法 响应 中 
断 ， 当 前 线程 未 获取 到 同步 状态 而 进入 同步 队列 中 ， 如 果 当 前 线程 被 
中 断 ， 则 该 方法 会 抛 出 InterruptedException 并 返回 。 

(3) AccquireNanos: 在 acquireInterruptibly 基 础 上 增加 了 超时 限 
制 ， 如 果 当 前 线程 在 超时 时 间 内 没有 获取 到 同步 状态 ， 那 么 将 会 返回 
false， 如 果 获 取 到 了 返回 true。 

(4) accquireShared: 共享 式 的 获取 同步 状态 ， 如 果 当 前 线程 未 获 
取 到 同步 状态 ， 将 会 进入 同步 队列 等 待 ， 与 独占 式 获 取 的 主要 区 别 是 


在 同一 时 刻 可 以 有 多 个 线程 获取 到 同步 状态 。 

(5) acquireSharedInterruptibly: 与 accquireShared 相 同 ， 该 方法 响 
应 中 断 。 

(6) tryAcquireSharedNanos: 在 acquireSharedInterruptibly 基 础 上 
增加 了 超时 限制 。 

(7) release: 独占 式 的 释放 同步 状态 ， 该 方法 会 在 释放 同步 状态 
之 后 ， 将 同步 队列 中 第 一 个 节点 包含 的 线程 唤醒 。 

(8) releaseShared: 共享 式 的 释放 同步 状态 。 

(9) getQueuedThreads () : 获取 等 待 在 同步 队列 上 的 线程 集 

队列 同步 器 提供 的 模板 方法 基本 上 分 为 3 类 : 独占 式 获取 与 释放 同 
步 状态 、 共 享 式 获 取 与 释放 同步 状态 ， 以 及 查询 同步 队列 中 的 等 待 线 
程 情 况 。 自 定义 同步 组 件 将 使 用 队列 同步 器 提供 的 模板 方法 来 实现 自 
己 的 同步 语义 。 

独占 锁 指 的 是 在 同一 时 刻 只 能 有 一 个 线程 获取 到 锁 ， 而 其 他 获取 
锁 的 线程 只 能 在 同步 队列 中 等 待 ， 只 有 获取 锁 的 线程 释放 了 锁 ， 后 续 
的 线程 才能 够 获取 锁 。 


代码 清单 5-32 ”独占 锁 示例 
import java.util.concurrent.TimeUnit; 
import java.util.concurrent.locks.AbstractQueuedSynchronizer; 
import java.util.concurrent.locks.Condition; 


import java.util.concurrent.locks.Lock; 


public class MutexDemo implements Lock( 
/1 静态 内 部 类 ， 用 于 自 定义 同步 器 
private static class SyncDemo extends AbstractQueuedSynchronizer{ 
// 是 否 处 于 占用 状态 
protected boolean isHeldExclusively()| 
return getState() == 1; 
} 
// 当 状态 为 0 时 获取 锁 
public boolean tryAcquire(int acquires) { 
if (compareAndSetState (0,1) ) ( 
setExclusiveOwnerThread (Thread.currentThread()); 


return true; 


} 
return false; 
} 
// 释 放 锁 ， 将 状态 设置 为 0 
protected boolean tryRelease(int releases) { 
if(getState() == O)( 
throw new IllegalMonitorStateException(); 
} 
setExclusiveOwnerThread (null); 
setState(0); 


return true; 


} 
@Override 
public void lock() { 
// TODO Auto-generated method stub 


@Override 
public void lockInterruptibly() throws InterruptedException { 
// TODO Auto-generated method stub 


@Override 
public Condition newCondition() { 
// TODO Auto-generated method stub 


return null; 


@Override 

public boolean tryLock() { 
// TODO Auto-generated method stub 
return false; 


@Override 
public boolean tryLock (long arg0, TimeUnit argl) 
throws InterruptedException { 
// TODO Auto-generated method stub 
return false; 


@Override 
public void unlock() { 
// TODO Auto-generated method stub 


} 


上 面 代 码 5-32 中 ， 独 占 锁 MutexDemo 是 一 个 自 定义 同步 组 件 ， 它 
在 同一 时 刻 只 允许 一 个 线程 占有 锁 。MutexDemo 中 定义 了 一 个 静态 内 
部 类 ， 该 内 部 类 继承 了 队列 同步 器 并 上 线 了 独占 式 获取 和 释放 同步 状 
态 。 用 户 使 用 独占 锁 时 并 不 会 直接 和 内 部 队列 同步 器 的 实现 打交道 ， 
而 是 调用 实现 的 方法 ， 以 获取 锁 的 lock ( 方法 为 例 ， 只 需要 在 方法 实 
现 中 调用 同步 器 的 模板 方法 acquire (int args) 即 可 ， 当 前 线程 调用 该 
方法 获取 同步 状态 失败 后 会 被 加 入 到 同步 队列 中 等 待 ， 这 样 就 大 大 降 
低 了 实现 一 个 可 靠 自 定义 同步 组 件 的 门槛 。 

队列 同步 器 依赖 内 部 的 一 个 FIFO 双 向 队列 来 完成 同步 状态 的 管 
理 ， 当 前 线程 获取 同步 状态 失败 时 ， 同 步 器 会 将 当前 线程 以 及 等 待 状 
人 态 等 信息 构造 成 为 一 个 节点 并 将 其 加 入 同步 队列 ， 同 时 会 阻塞 当前 线 
程 ， 当 同步 状态 释放 时 ， 会 把 首 节点 中 的 线程 唤醒 ， 使 其 再 次 尝试 获 
取 同 步 状 态 。 没 有 成 功 获 取 同 步 状 态 的 线程 将 会 成 为 节点 加 入 该 队列 
的 尾部 。 这 里 我 们 所 说 的 节点 ， 用 来 保存 获取 同步 状态 失败 的 线程 引 
用 、 等 待 状态 以 及 前 驱 和 后 继 结 点 信息 。 

共享 式 获 取 与 独占 式 获 取 最 主要 的 区 别 在 于 同一 时 刻 是 否 有 多 个 
线程 同时 获取 到 同步 状态 。 以 文件 的 读 写 为 例 ， 如 果 一 个 程序 在 对 文 
件 进 行 读 操作 ， 那 么 这 一 时 刻 对 于 该 文件 的 写 操作 均 被 阻塞 ， 而 读 操 
作 能 够 同时 进行 。 写 操作 要 求 对 资源 的 独占 式 访 问 ， 而 读 操 作 可 以 是 
共享 式 访 问 。 


5.2.5 可 重 入 锁 


重 入 锁 就 是 支持 重 进入 的 锁 ， 它 表示 该 锁 能 够 支持 一 个 线程 对 资 
源 的 重复 加 锁 ， 还 支持 获取 锁 时 的 公平 和 非 公 平 性 选择 。Java5 提 供 了 
重 入 锁 ReentrantLock[2] 的 实现 。 

“可 重 入 锁 ” 的 概念 我 们 可 以 理解 为 ， 自 己 可 以 再 次 获取 自己 的 内 
部 锁 。 比 如 有 1 个 线程 获得 了 某 个 对 象 的 锁 ， 此 时 这 个 对 象 锁 还 没有 各 
放 ， 当 其 再 次 想 获 取 这 个 对 象 的 锁 时 还 是 可 以 获取 的 ， 如 果 不 可 锁 重 


入 的 话 ， 就 会 造成 死 锁 。 可 重 入 锁 也 支持 在 父子 类 继承 的 环境 中 工 

为 了 实现 重 进入 ， 我 们 需要 解决 以 下 两 个 问题 : 

(1) 线程 再 次 获得 锁 。 锁 需要 去 识别 获取 锁 的 线程 是 否 为 当前 占 
据 锁 的 线程 ， 如 果 是 ， 则 再 次 获取 锁 。 

(2) 锁 的 最 终 释 放 。 线 程 重 复 n 次 获取 了 锁 ， 随 后 在 第 n 次 释放 该 
锁 喉 ， 其 他 线程 能 够 获取 到 该 锁 。 锁 的 最 终 释 放 要 求 锁 对 于 获取 进行 
计数 自 增 ， 计 数 表 示 当 前 锁 被 重复 获取 的 次 数 ， 而 锁 被 释放 时 ， 计 数 
自 减 ， 当 计数 等 于 0 时 表示 锁 已 经 成 功 释放 。 

我 们 之 前 讲 的 例子 ，MutexDemo， 当 一 个 线程 调用 MutexDemo 的 
lock () 方法 获取 锁 之 后 ， 如 果 再 次 调用 lock () 方法 ， 则 该 线程 将 会 
被 自己 所 阻塞 ， 原 因 是 MutexDemo 在 实现 tryAcquire 方 法 时 没有 考虑 占 
有 锁 的 线程 再 次 获取 锁 的 场景 ， 而 在 调用 tryAcquire 方 法 时 返回 了 
false， 导 致 该 线程 被 阻塞 。 简 单 地 说 ，MutexDemo 是 一 个 不 支持 重 进 
入 的 锁 。 Synchronized 关键 字 隐 式 地 实现 了 重 进 入 ， 比 如 一 个 
synchronized 修饰 的 递归 方法 ， 在 方法 执行 时 ， 执 行 线程 在 获取 了 锁 之 
后 仍 能 连续 多 次 地 获得 该 锁 ， 而 不 像 独 占 锁 方式 出 现 阻 塞 自己 的 情 
况 。 

锁 获取 的 公平 性 问题 是 指 ， 如 果 在 绝对 事件 上 ， 先 对 锁 进行 获取 
的 请 求 一 定 先 被 满足 ， 那 么 这 个 锁 是 公平 的 ， 反 之 ， 是 不 公平 的 。 公 
平 的 获取 锁 ， 也 就 是 等 待 时 间 最 长 的 线程 最 优先 获取 锁 ， 也 可 以 说 获 
取 锁 是 一 个 顺序 的 行为 。 ReetrantLock 提 供 了 一 个 构造 水 数 ， 能 够 控制 
锁 是 否 是 公平 的 。 事 实 上 ， 公 平 的 锁 机 制 没 有 非 公平 的 效率 高 ， 但 
是 ， 并 不 是 任何 场景 都 是 以 TPS 作 为 唯一 的 指标 ， 公 平 锁 能 够 减少 低 优 
先 级 线程 等 待 发 生 的 概率 ， 等 待 越久 的 请 求 越 是 能 够 得 到 优先 满足 。 

ReentrantLock 虽 然 没 能 像 Synchronized 关 键 字 一 样 支持 隐 式 的 重 进 
入 ， 但 是 在 调用 lock () 方法 时 ， 已 经 获取 到 锁 的 线程 ， 能 够 再 次 调用 
lock () 方法 获取 锁 而 不 被 阻塞 。 

ReentrantLock 拥 有 Synchronized 相 同 的 并 发 性 和 内 存 语义 ， 此 外 还 
多 了 锁 投 票 、 定 时 锁 等 候 和 中 断 锁 等 候 等 机 制 。 

线程 A 和 B 都 要 获取 对 象 O 的 锁定 ， 假 设 A 获 取 了 对 象 O 锁 ，B 将 等 
待 A 释 放 对 0 的 锁定 ， 如 果 使 用 synchronized， 如 果 A 不 释放 ，B 将 一 直 


等 下 去 ， 不 能 被 中 断 。 如 果 使 用 ReentrantLock， 如 果 A 不 释放 ， 可 以 使 
B 在 等 待 了 足够 长 的 时 间 以 后 ， 中 断 等 待 ， 而 干 别 的 事情 。 
ReentrantLock 获 取 锁 定 四 种 方式 。 

(1) lock () ， 如 果 获 取 了 锁 立 即 返回 ， 如 果 别 的 线程 持 有 锁 ， 
当前 线程 则 一 直 处 于 休眠 状态 ， 直 到 获取 锁 。 

(2) tryLock () ， 如 果 获 取 了 锁 立 即 返回 true， 如 果 别 的 线程 正 
持 有 锁 ， 立 即 返回 false。 

(3) tryLock (long timeout, TimeUnit, unit) ， 如 果 获 取 了 锁定 
立即 返回 tue， 如 果 别 的 线程 正 持 有 锁 ， 会 等 待 参 数 给 定 的 时 间 ， 在 等 
待 的 过 程 中 ， 如 果 获 取 了 锁定 ， 就 返回 true， 如 果 等 竺 超时， 返回 
false; 

(4) lockInterruptibly， 如 果 获 取 了 锁定 立即 返回 ， 如 果 没 有 获取 
锁定 ， 当 前 线程 处 于 休眠 状态 ， 直 到 锁定 或 者 当前 线程 被 别 的 线程 中 
Wr. 

synchronized 是 在 JVM 层 面 上 实现 的 ， 不 但 可 以 通过 一 些 监控 工具 
监控 synchronized 的 锁定 ， 而 且 在 代码 执行 时 出 现 异 常 ，JVM 会 自动 释 
放 锁 定 ， 但 是 使 用 Lock 则 不 行 ，lock 是 通过 代码 实现 的 ， 要 保证 锁定 一 
定 会 被 释放 ， 就 必须 将 unLock () 放 到 finally{} 中 。 

在 资源 竞争 不 是 很 激烈 的 情况 下 ，Synchronized 的 性 能 要 优 于 
ReetrantLock， 但 是 在 资源 竞争 很 激烈 的 情况 下 ，Synchronized 的 性 能 
会 下 降 几 十 倍 ， 但 是 ReetrantLock 的 性 能 可 以 维持 常态 。 


5.2.6 读 写 锁 


独占 锁 和 可 重 入 锁 都 属于 排他 锁 ， 这 些 锁 在 同一 时 刻 只 允许 一 个 
线程 进行 访问 ， 而 读 写 锁 在 同一 时 刻 可 以 允许 多 个 读 线程 访问 ， 但 是 
在 写 线 程 访问 时 ， 所 有 的 读 线程 和 其 他 写 线程 均 被 阻塞 。 读 写 锁 维护 
了 一 对 锁 ， 一 个 读 锁 和 一 个 写 锁 ， 通 过 分 离 读 锁 和 写 锁 ， 使 得 并 发 性 
相 比 一 般 的 排他 锁 有 了 很 大 提升 。 

Java fe (2H BY I 5 S6 是 ReentrantReadWriteLock ， 注 } 
ReentrantReadWriteLock 和 ReentrantLock 不 是 继承 关系 ， 但 都 是 基于 
AbstractQueuedSynchronizer 来 实现 。 


cot 


i3 


在 没有 读 写 锁 支 持 之 前 ， 如 果 需 要 完成 上 述 工 作 就 要 使 用 Java 的 等 
待 通知 机 制 ， 就 是 当 写 操作 开始 时 ， 锁 有 晚 于 写 操 作 的 读 操 作 均 会 进 
入 等 待 状 态 ， 只 有 写 操作 完成 并 进行 通知 之 后 ， 所 有 等 待 的 读 操 作 才 
能 继续 执行 ， 注 意 ， 写 操作 之 间 依 靠 Synchronized 关 键 字 进行 同步 。 这 
样 做 的 目的 是 使 读 操 作 能 够 读 取 到 正确 的 数据 ， 不 会 出 现 脏 读 。 读 写 
锁 也 能 够 简化 读 写 交互 场景 的 编程 方式 。 例 如 ， 程 序 中 定义 一 个 共享 
的 用 作 缓 存 数据 结构 ， 它 大 部 分 时 间 提 供 读 服务 ， 包 括 查询 和 检索 ， 
而 写 操 作 占 有 的 时 间 很 少 ， 写 操作 完成 之 后 的 更 新 需要 对 后 续 的 服务 
可 见 。 

改 用 读 写 锁 实 现 上 述 功能 ， 只 需要 在 读 操作 时 获取 读 锁 ， 写 操作 
时 获取 写 锁 即 可 。 当 写 锁 被 获取 到 时 ， 后 续 ( 非 当 前 写 操作 线程 ) 的 
读 写 操作 都 会 被 阻塞 ， 写 锁 释 放 之 后 ， 锁 有 操作 继续 执行 ， 编 程 方式 
相对 于 使 用 等 待 通知 机 制 的 实现 方式 而 言 ， 变 得 简单 明了 。 注 意 ， 在 
同一 线程 中 ， 持 有 读 锁 后 ， 不 能 直接 调用 写 锁 的 lock 方 法 ， 否 则 会 造成 
死 锁 。 

一 般 情 况 下 ， 读 写 锁 的 性 能 都 会 比 排他 锁 好 ， 因 为 大 多 数 场景 读 
都 比 写 多 ， 读 写 锁 能 够 提供 比 排 他 锁 更 好 的 并 发 性 和 吞吐 量 。 我 们 可 
以 把 读 写 锁 的 特性 总 结 为 以 下 几 个 。 

m 读 取 锁 允 许多 个 reader 线 程 同 时 持 有 ， 而 写 入 锁 最 多 只 能 有 一 个 
writter 线 程 持 有 。 

香 读 写 锁 的 使 用 场合 : 读 取 共享 数据 的 频率 远大 于 修改 共享 数据 的 
频率 。 在 上 述 场合 下 ， 使 用 读 写 锁 控 制 共 享 资源 的 访问 ， 可 以 提高 
发 性 能 。 

m 如 果 一 个 线程 已 经 持 有 了 写 入 锁 ， 则 可 以 再 持 有 读 写 锁 。 相 反 ， 
如 果 一 个 线程 已 经 持 有 了 读 取 锁 ， 则 在 释放 该 读 取 锁 之 前 不 能 再 持 有 
写 入 锁 。 

m 可 以 调用 写 入 锁 的 newCondition () 方法 获取 与 该 写 入 锁 绑 定 的 
Condition 对 ， 此 时 与 普通 的 互 斥 锁 并 没有 什么 区 别 。 但 是 调用 读 取 锁 
的 newCondition () 方法 将 抛 出 异常 。 


5.2.7 偏向 锁 和 轻 量 级 锁 


Java6 为 了 减少 获得 锁 和 释放 锁 带 来 的 性 能 消耗 ， 引 入 了 “偏向 锁 ” 
和 “ 轻 量 级 锁 ?， 在 Java6 种 ， 锁 一 共有 4 种 状态 ， 级 别 从 低 到 高 依次 是 : 
无 锁 状 态 、 偶 向 锁 状 态 、 轻 量 级 锁 状 态 和 重量 级 锁 状 态 ， 这 几 个 状态 
会 随 着 竞争 情况 逐渐 升级 。 锁 可 以 升级 但 不 能 降级 ， 意 味 着 偶 向 锁 升 
级 成 轻 量 级 锁 后 不 能 降级 成 偏向 锁 。 这 种 锁 升 级 却 不 能 降级 的 策略 ， 
目的 是 为 了 提高 获得 锁 和 释放 锁 的 效率 。 

1. 偏 向 锁 

大 多 数 情况 下 ， 锁 不 仅 不 存在 多 线程 竞争 ， 而 且 总 是 由 同一 线程 
多 次 获得 ， 为 了 让 线程 获得 锁 的 代价 更 低 而 引入 了 偏向 锁 。 当 一 个 线 
程 访 问 同步 块 冰 获 取 锁 时 ， 会 在 对 象 头 和 栈 帧 中 的 锁 记 录 里 存储 锁 偶 
向 的 线程 ID ， 以 后 该 线程 在 进入 和 退出 同步 块 时 不 需要 进行 CAS 操 作 
来 加 锁 和 解锁 ， 只 需 简 单 地 测试 一 下 对 象 头 的 Mark Word 里 是 否 存储 着 
指向 当前 线程 的 偏向 锁 。 如 果 测 试 成 功 ， 表 示 线 程 已 经 获得 了 锁 。 如 
果 测 试 失败 ， 则 需要 再 测试 一 下 Mark Word 中 偏向 锁 的 标识 是 否 设置 成 
了 1 (表示 当前 是 偏向 锁 ) : 如 果 没 有 设置 ， 则 使 用 CAS 竞 争 锁 ; WR 
设置 了 ， 则 尝试 使 用 CAS 将 对 象 头 的 偏向 锁 指 向 当前 线程 。 

1) 偏向 锁 的 撤销 

偏向 锁 使 用 了 一 种 等 到 竞争 出 现 才 释放 锁 的 机 制 ， 所 以 当 其 他 线 
程 尝试 竞争 偏向 锁 时 ， 持 有 偏向 锁 的 线程 才 会 释放 锁 。 偏 向 锁 的 撤 
销 ， 需 要 等 待 全 局 安全 点 (在 这 个 时 间 点 上 没有 正在 执行 的 字 节 
码 ) 。 它 会 首先 暂停 拥有 偏向 锁 的 线程 ， 然 后 检查 持 有 偏向 锁 的 线程 
是 否 活 着 ， 如 果 线 程 不 处 于 活动 状态 ， 则 将 对 象 头 设置 成 无 锁 状态 ; 
如 果 线 程 仍然 活着 ， 拥 有 偏向 锁 的 栈 会 被 执行 ， 遍 历 偏 向 对 象 的 锁 记 
录 ， 栈 中 的 锁 记 录 和 对 象 头 的 Mark Word 要 么 重新 偏向 于 其 他 线程 ， 要 
么 恢复 到 无 锁 或 者 标记 对 象 不 适合 作为 偏向 锁 ， 最 后 唤醒 暂停 的 线 
程 。 

2) 关闭 偏向 锁 

偏向 锁 在 Java6 和 Java7 里 是 默认 启用 的 ， 但 是 它 在 应 用 程序 启动 几 
秒 钟 之 后 才 被 激活 ， 如 有 必要 可 以 使 用 JVM 人 参数 来 关闭 延迟 : -XX: 
BiasedLockingStartupDelay=0。 如 果 你 确定 应 用 程序 里 所 有 的 锁 通常 情 
况 下 处 于 竞争 状态 ， 可 以 通过 JVM 参 数 关 闭 偏 向 锁 : -XX : 
UseBiasedLocking=false， 那 么 程序 默认 会 进入 轻 量 级 锁 状 态 。 


2. 轻 量 级 锁 

1) 轻 量 级 锁 加 锁 

线程 在 执行 同步 块 之 前 ，JVM 会 先 在 当前 线程 的 栈 帧 中 创建 用 于 
存储 锁 记 录 的 空间 ， 并 将 对 象 头 中 的 Mark Word 复 制 到 锁 记 录 中 ， 官 方 
称 为 Displaced Mark Word。 然 后 线程 尝试 使 用 CAS 将 对 象 头 中 的 Mark 
Word 替 换 为 指向 锁 记 录 的 指针 。 如 果 成 功 ， 当 前 线程 获得 锁 ， 如 果 失 
败 ， 表 示 其 他 线程 竞争 锁 ， 当 前 线程 便 尝 试 使 用 自 旋 来 获取 锁 。 

2) 轻 量 级 锁 解 锁 

轻 量 级 解锁 时 ， 会 使 用 原子 的 CAS 操 作 将 Displaced Mark Word 替 换 
回 到 对 象 头 ， 如 果 成 功 ， 则 表示 没有 竞争 发 生 。 如 果 失 败 ， 表 示 当 前 
锁 存 在 竞争 ， 锁 就 会 膨胀 成 重量 级 锁 。 

因为 自 旋 会 消耗 CPU ， 为 了 避免 无 用 的 自 旋 (比如 获得 锁 的 线程 
被 阻塞 住 了 ) ， 一 旦 锁 升 级 成 重量 级 锁 ， 就 不 会 恢复 到 轻 量 级 状态 。 
当 锁 处 于 这 个 状态 下 ， 其 他 线程 试图 获取 锁 时 ， 都 会 被 阻塞 住 ， 当 持 
有 锁 的 线程 释放 锁 之 后 会 唤醒 这 些 线 程 ， 被 唤醒 的 线程 就 会 进行 新 一 
轮 的 夺 锁 之 争 。 

锁 的 优 缺 点 的 对 比如 表 5-1 所 示 。 

表 5-1 锁 对 比 表 


Oa 加 锁 和 解锁 不 需要 额外 的 消耗 ，| 如 果 线程 间 存 在 锁 | 适用 于 只 有 一 个 线程 访问 同 
和 执行 非 亦 同步 方法 相 比 仅 存 | Gk. RU | 步 块 场景 
在 纳 秒 级 的 差距 的 锁 撤 销 的 消耗 


轻 量 级 锁 竞争 的 线程 不 会 阻塞 , 提高 了 程 | 如 果 始 终 得 不 到 竞 | 追求 响应 时 间 ， 同 步 快 执行 
序 的 响应 速度 争 的 线程 ， 使 用 自 | 速度 非常 人 

旋 会 消耗 CPU 
线程 竞争 不 使 用 自 旋 , 不 会 消耗 | 线程 阻塞 ， 响 应 时 | 追求 乔 吐 量 ， 同 步 块 执行 速 
CPU 间 绥 慢 度 较 长 


5.3 增加 程序 并 行 


现代 CPU 架构 将 多 核 、 多 硬件 执行 线程 技术 摆 到 了 程序 员 面前 。 
这 意味 着 我 们 可 以 利用 更 多 的 CPU 资源 做 更 多 的 工作 。 然 而 ， 要 利用 
好 这 些 额外 的 CPU 资产， 运行 于 其 上 的 程序 必须 要 能 够 并 行 工作 。 换 
句 话说 ， 这 些 程序 需要 按照 多 线程 的 方式 构造 或 设计 才能 充分 利用 额 
外 的 硬件 线程 。 

单线 程 的 Java 应 用 程序 无 法 充分 利用 现代 CPU 染 构 上 额外 的 硬件 线 
程 。 那 些 单线 程 应 用 必须 按照 多 线程 的 方式 重 构 才 能 并 行 工 作 。 此 
外 ， 很 多 Java 应 用 程序 都 有 单线 程 阶段 或 操作 ， 尤 其 是 初始 化 或 启动 阶 
段 。 通 过 并 行 执行 任务 、 同 事 利用 多 个 线程 ， 这 些 Java 应 用 程序 的 初始 
化 或 启动 性 能 将 大 幅 提升 。 


5.3.1 并 发 计数 器 


多 核 时 代 来 临 了 之 后 ， 大 家 都 开始 使 用 并 发 计数 器 ， 我 们 先 来 看 
一 下 Java 迄 今 为 止 提 供 了 哪些 实现 方式 ， 它 们 的 性 能 和 这 个 新 的 API 相 
比 ， 又 有 什么 不 同 。 

脏 计数 器 ， 选 择 这 种 方式 意味 着 多 线程 直接 并 发 读 写 一 个 普通 对 
象 或 者 静态 字段 。 不 平 的 是 ， 这 么 做 是 行 不 通 的 。 有 两 个 原因 ， 一 是 
在 Java 里 ，A+=B 操 作 不 是 原子 的 。 如 果 你 打开 编译 后 的 字 节 码 看 一 
下 ， 你 会 发 现 至 少 有 四 条 指令 ， 第 一 条 是 从 堆 里 将 字段 值 加 载 到 线程 
栈 里 ， 第 二 条 是 加 载 要 增加 的 值 ， 第 三 条 指令 将 它们 进行 相 加 ， 第 四 
条 则 将 结果 写 回 到 字段 中 。 如 果 多 个 线程 同时 在 同一 个 内 存 位 置 进行 
这 个 操作 ， 你 的 一 个 写 操 作 很 有 可 能 就 丢掉 了 ， 因 为 另 一 个 线程 可 能 
会 覆盖 了 它 的 值 。 还 有 一 个 很 恶心 的 事 就 是 这 个 值 的 可 见 性 。 

synchronzied 关 键 字 ， 它 是 最 基础 的 同步 操作 了 ， 只 要 你 在 读 写 
值 ， 它 就 会 阻塞 住 其 他 的 所 有 线程 。 这 种 方式 的 确 行 得 通 ， 不 过 有 一 
点 事 可 以 肯定 的 ， 你 的 程序 会 排 长 队 的 。 

读 写 锁 (RWLock) ， 这 个 和 基础 的 Java 锁 相 比 就 巧妙 了 些 ， 它 可 
以 让 你 区 分 出 那些 要 修改 值 因 此 需要 阻塞 别人 的 进程 以 及 那些 只 是 读 
取 值 不 需要 进入 临界 区 的 。 虽 然 这 个 方法 有 的 时 候 很 高 效 (比如 写 线 
程 的 数量 比较 少 的 话 ) ， 但 还 是 相当 无 语 ， 因 为 当 你 获取 写 锁 的 时 候 
还 是 会 阻塞 住 其 他 线程 的 执行 。 


volatile 关 键 字 ， 这 个 经 常会 被 误 用 的 关键 字 会 直 JIT 编 译 停止 在 运 
行 时 进行 机 器 码 的 优化 工作 ， 因 此 字段 一 旦 有 更 新 别 的 线程 马上 就 能 
看 到 。 它 会 使 得 JIT 编 译 器 经 常 玩 的 一 些 把 戏 比 如 说 调整 赋值 语句 的 顺 
序 这 些 无 法 进行 。JIT 编 译 器 有 可 能 会 改变 字段 的 赋值 顺序 。 什 么 ， 你 
再 说 一 遍 ? 是 的 ， 你 听 的 没 错 。 这 个 神秘 的 小 把 戏 使 得 它 可 以 减 小 程 
序 访问 全 局 堆 的 次 数 ， 同 时 它 还 能 保证 不 会 影响 到 你 的 程序 的 执行 。 
这 真是 有 点 偷偷 摸 摸 的 感觉 。 

那 什么 时 候 应 该 使 用 volatile 计 数 器 ? 如 果 你 只 有 一 个 线程 在 更 新 
一 个 值 ， 而 多 个 线程 在 读 的 话 ， 这 是 个 很 合适 的 场景 。 因 为 完全 没有 
竞争 。 

你 可 能 会 问 为 什么 不 都 使 用 它 就 完了 ? 因为 如 果 有 多 个 线程 在 更 
新 的 话 就 会 有 问题 了 。 由 于 A+=B 不 是 一 个 原子 操作 ， 这 么 做 的 话 可 能 
会 覆盖 掉 别 人 写 的 话 。 在 Java 8 以 前 ， 这 种 情况 你 就 只 能 用 
AtomicInteger f o 

AtomicInteger， 这 组 类 使 用 了 处 理 器 的 CAS (compare-and-swap) 
指令 来 更 新 计数 器 的 值 。 听 起 来 不 错 吧 ? 一 半 一 半 吧 。 由 于 它 直 接 使 
用 机 器 指令 来 设置 值 ， 因 此 对 其 他 线程 的 影响 最 小 。 不 好 的 一 面 是 如 
果 它 和 别 的 线程 有 竞争 赋值 失败 了 ， 它 会 继续 重 试 。 在 高 并 发 的 条 件 
下 ， 这 就 成 了 一 个 自 旋 锁 ， 线 程 会 在 一 个 无 限 的 循环 内 不 断 的 党 试 赋 
值 ， 直 到 成 功 为止 。 我 们 可 不 太 想 看 到 这 种 局 面 。Java 8 来 了 ， 还 带 来 
了 LongAdders。 

Adders， 这 是 Java8 非 常 棒 的 新 的 API， 从 使 用 者 的 角度 来 说 ， 它 很 
像 AtomicInteger。 只 需要 创建 一 个 LongAdder 对 象 ， 然 后 使 用 intValue 

() 以 及 add O 方法 来 获取 和 设置 它 的 值 。 而 奇迹 就 发 生 在 这 一 切 的 
背后 。 如 果 由 于 竞争 这 个 类 的 CAS 操 作 失 败 了 的 话 ， 它 会 要 添加 的 值 
存 到 一 个 线程 本 地 的 内 部 的 cell 对 象 里 。 当 intValue () 方法 调用 的 时 
候 ， 它 把 这 些 cell 的 值 加 到 总 和 里 ， 就 减少 了 CAS 重 试 或 者 阻塞 别 的 线 
程 的 情况 。 

假设 我 们 来 做 一 个 基准 测试 ， 把 一 个 计数 器 设置 为 0， 然 后 多 个 线 
程 开 始 读 取 并 进行 自 增 。 当 计数 器 到 达 10^8 的 时 候 停止 。 假 设 我 们 在 
一 个 4 核 的 7 处 理 器 上 运行 这 个 测试 。 


我 用 了 10 个 线程 来 运行 这 个 基准 测试 一 读 写 分 别 使 用 5 个 线程 来 进 
行 ， 这 样 的 话 会 出 现 严 重 的 竞争 条 件 ， 如 图 5-2 所 示 。 注 意 ， 脏 读 和 
volatile 都 有 可 能 产生 脏 值 。 


1129 4543 12091 133555 2591 1590 
1101 4679 13177 132676 3266 1642 
1079 4077 17157 180287 3128 1459 
1124 3662 16123 184923 3262 1560 
1089 4723 16366 179975 3117 1514 


1117 4535 16647 155151 3014 1403 


1100 3615 17421 138867 2759 LEEI 


1143 3505 17009 147162 3147 1375 
317 5005 17173 169682 3081 1409 


978 4786 17296 160799 2808 1421 


| 1017.7 4313 16046 | 158307.7 | 3017.3 1470.4 


图 5-2 读 写 基 准 测试 

总 的 来 说 ， 并 发 的 Adder 类 和 AtomicInteger 相 比 有 60 天 100% 的 性 能 

提升 。 此 外 ， 增 加 线程 不 会 对 结果 有 太 大 影响 ， 除 非 是 使 用 锁 的 情 

况 。 最 后 我 们 需要 注意 到 ， 如 果 使 用 synchronized 或 者 读 写 锁 ， 性 能 会 
有 很 大 的 损耗 ， 慢 至 少 一 个 数量 级 。 


5.3.2 减少 上 下 文 切换 次 数 


多 任务 系统 往往 需要 同时 执行 多 道 作 业 。 如 果 作 业 数 大 于 机 器 的 
CPU 数 ， 一 颗 CPU 同 时 只 能 执行 一 项 任务 ， 那 么 为 了 让 用 户 感 觉 这 些 
任务 正在 同时 进行 ， 操 作 系 统 的 设计 者 巧妙 地 利用 了 时 间 片 轮转 的 方 
式 ，CPU 给 每 个 任务 都 服务 一 定 的 时 间 ， 然 后 把 当前 任务 的 状态 保存 
下 来 ， 在 加 载 下 一 任务 的 状态 后 ， 继 续 服务 下 一 任务 。 任 务 的 状态 保 


存 及 再 加 载 ， 这 段 过 程 就 叫 作 上 下 文 切换 。 时 间 片 轮转 的 方式 使 多 个 
任务 在 同一 颗 CPU 上 执行 变 成 了 可 能 ， 但 同时 也 带 来 了 你 存 现场 和 加 
载 现 场 的 直接 消耗 。 更 精确 的 说 法 是 ， 上 下 文 切 换 会 遍 来 直接 和 间接 
两 种 因素 影响 程序 性 能 的 消耗 。 这 些 直接 消耗 包括 CPU 寄存 器 需要 保 
存 和 加 载 、 系 统 调度 器 的 代码 需要 执行 、TLB[3] 实 例 需 要 重新 加 载 、 
CPU 的 pipeline[4] 需 要 被 清空 、 间 接 消 耗 指 的 是 多 核 的 cache 之 间 的 共 
享 数据 、 间 接 消耗 对 于 程序 的 影响 要 看 线程 工作 区 操作 数据 的 大 小 
等 。 

上 下 文 切换 又 分 为 2 种 : 让 步 式 上 下 文 切 换 和 抢占 式 上 下 文 切 换 。 
前 者 是 指 执行 线程 主动 释放 CPU ， 与 锁 竞 争 严 重 程度 成 正比 ， 可 通过 
减少 锁 竞争 来 避免 ， 后 者 是 指 线程 因 分 配 的 时 间 片 用 尽 而 被 迫 放 弃 
CPU 或 者 被 其 他 优先 级 更 高 的 线程 所 抢占 ， 一 般 由 于 线程 数 大 于 CPU 
可 用 核心 数 引 起 ， 可 通过 调整 线程 数 ， 适 当 减 少 线程 数 来 避免 。 

现在 Linux 是 大 多 基于 抢占 式 ，CPU 给 每 个 任务 一 定 的 服务 时 间 ， 
当时 间 片 轮转 的 时 候 ， 需 要 把 当前 状态 保存 下 来 ， 同 时 加 载 下 一 个 任 
务 ， 这 个 过 程 叫 作 上 下 文 切换 。 时 间 片 轮转 的 方式 ， 使 得 多 个 任务 利 
用 一 个 CPU 执行 成 为 可 能 ， 但 是 保存 现场 和 加 载 现场 ， 也 融 来 了 性 能 
消耗 。 我 们 可 以 通过 VYVMSTAI 命 令 来 获取 上 下 文 切 换 的 次 数 。 


代码 清单 5-33 VMSTAT 获取 上 下 文 切换 的 次 数 


[root@zuoyel ~]# vmstat 1 100 


r b swpd free buff cache si so bi bo in cs us sy id wa st 
1 0 0 2466584 172864 3091060 0 0 5 94 35 157 2 5912 0 


Vmstat 命 令 返 回 的 结果 是 系统 层面 的 ， 如 果 想 看 查看 特定 进程 的 
情况 ， 可 以 使 用 pidstat。 


代码 清单 5-34 pidstat 返回 进程 上 下 文 切换 情况 


root@zuoyel ~]# pidstat 

Linux 2.6.32-504.e16.x86 64 (zuoyel) 11/24/2015 X86 64 (4 CPU) 
10:23:33 AM PID  $usr $system $guest %CPU CPU Command 

10:23:33 AM 1 0.00 0.00 0.00 0.00 3 init 

10:23:33 M 3 0:00 0.22 0400 — 0,22 0 migration/0 
10:23:33 AM 4 0.00 0.01 0.00 0.01 0 ksoftirqd/0 
10:23:33 AM 6 0.00 0.00 0.00 0.00 0 watchdog/0 

10:23:33 AM 1 $99 -0:11 0 ET 1 migration/1 


PID: 进程 pid ; 

%usr: 进程 在 用 户 态 运行 所 占 cpu 时 间 比 率 ; 

%system: 进程 在 内 核 态 运行 所 占 cpu 时 间 比 率 ; 

%CPU: 进程 运行 所 占 cpu 时 间 比 率 ，; 

CPU: 指示 进程 在 哪个 核 运行 ; 

Command: 拉 起 进程 对 应 的 命令 。 

注意 ， 执 行 pidstat 默 认输 出 信息 为 系统 启动 后 到 执行 时 间 点 的 统计 
信息 ， 因 而 即使 当前 某 进 程 的 cpu 占 用 率 很 高 ， 输 出 中 的 值 有 可 能 仍 为 
0o 

Context Switch 过 高 ， 会 导致 CPU 像 个 搬运 工 ， 频 繁 在 寄存 器 和 运 
行 队 列 直接 奔波 ， 更 多 的 时 间 花 在 了 线程 切换 ， 而 不 是 真正 工作 的 线 
程 上 。 直 接 的 消耗 包括 CPU 寄存 器 需要 保存 和 加 载 ， 系 统 调度 器 的 代 
码 需要 执行 。 间 接 消 耗 在 于 多 核 cache 之 间 的 共享 数据 。 

综合 上 面 的 内 容 ， 我 们 可 以 知道 真正 干 活 的 不 是 线程 ， 而 是 
CPU. 线程 越 多 ， 干 活 不 一 定 越 快 ， 我 们 需要 减少 上 下 文 切 换 次 数 ， 
会 让 系统 更 快速 。 

那么 高 并 发 的 情况 下 什么 时 候 适 合 单线 程 ， 什 么 时 候 适 合 多 线程 
呢 ? 

适合 单线 程 的 场景 : 单个 线程 的 工作 逻辑 简单 ， 而 且 速 度 非常 
快 ， 比 如 从 内 存 中 读 取 某 个 值 ， 或 者 从 Hash 表 根据 key 获 得 某 个 value。 


Redis 和 Node.js 这 类 程序 都 是 单线 程 ， 适 合 单个 线程 简单 快速 的 场景 。 

适合 多 线程 的 场景 : 单个 线程 的 工作 逻辑 复杂 ， 等 待 时 间 较 长 或 
者 需要 消耗 大 量 系 统 运算 资源 ， 比 如 需要 从 多 个 远程 服务 获得 数据 并 
计算 ， 或 者 图 像 处 理 。 


5.3.3 针对 Thread 类 的 更 新 


Java7 对 于 表示 线程 的 类 java.lang.Thread 所 做 的 更 新 主要 明确 了 
Thread 类 的 对 象 在 某 些 情 况 下 的 行为 ， 并 且 去 掉 了 之 前 使 用 中 比较 模糊 
的 和 设计 不 合理 的 部 分 。 首 先 将 Thread 类 的 clone 方 法 改进 为 总 是 抛 出 
CloneNotSupportedException 异 常 ， 这 是 因为 对 一 个 Thread 类 的 对 象 进行 
克隆 是 没有 意义 的 。Java7 显 式 地 禁止 了 对 Thread 类 对 象 的 克隆 操作 。 
其 次 ， 在 Java7 之 前 ，Thread 类 的 join 方 法 和 sleep 方 法 可 以 接收 一 个 long 
类 型 的 参数 表示 等 待 的 时 间 ， 但 是 并 没有 定义 当 这 个 参数 为 负数 时 的 
处 理 方式 。Java7 中 规定 : 如 果 这 两 个 方法 的 等 待 时 间 参 数 的 值 为 负 
数 ， 则 会 抛 出 HlegalArgumentException 异 常 。 

另外 一 个 明确 了 参数 处 理 行 为 的 是 Thread 类 的 构造 方法 。 在 创建 
Thread 类 的 对 象 时 可 以 使 用 的 参数 包括 : 表示 Thread 类 的 对 象 所 在 线程 
组 的 java.lang.ThreadGroup 类 的 对 象 ， 表 示 需 要 运行 的 任务 的 
java.lang.Runnable 接 口 的 实现 对 象 ， 以 及 表示 线程 名 称 的 String 类 的 对 
象 。 如 果 传 入 的 ThreadGroup 类 的 对 象 为 null， 那 么 会 先 尝试 调用 当前 
配置 好 的 安全 管理 器 (java.lang.SecurityManager 类 的 对 象 ) 的 
getThreadGroup 方 法 来 获取 ThreadGroup 类 的 对 象 ; 如 果 没 有 配置 安全 
管理 器 或 getThreadGroup 方 法 也 返回 null， 那 么 会 使 用 当前 线程 所 在 线 
程 组 的 ThreadGroup 类 的 对 象 ; 如 果 传 入 的 Runnable 接 口 的 实现 对 象 为 
null， 那 么 会 调用 Thread 类 的 对 象 本 身 的 run 方 法 ; 如 果 传 入 的 线程 名 称 
是 null， 会 抛 出 NullPointException 异 常 。 

在 调用 Thread 类 的 setContextClassLoader 方 法 来 设置 线程 上 下 文 类 
加 载 器 时 ， 如 果 传 入 的 参数 为 null， 则 表明 使 用 的 是 系统 类 加 载 器 。 如 
果 无 法 使 用 系统 类 加 载 器 ， 就 使 用 局 动 类 加 载 器 。 同 样 的 ， 如 果 当 前 
线程 上 下 文 加 载 器 是 系统 类 加 载 器 或 启动 类 加 载 器 ， 那 么 
getContextClassLoader 方 法 的 返回 值 是 null。 


5.3.4 Fork/JoinTE2R 


在 Java5 版 本 的 时 候 ，Java 设 计 者 们 通过 JSR-166 的 规范 制定 ， 在 
java.utilconcurrent 包 下 为 开发 人 员 提供 了 基于 粗 粒 度 的 多 核 并 行 计算 框 
架 ， 只 不 过 这 种 基于 粗 粒 度 的 并 行 计 算 模式 ， 并 不 能 在 处 理 效 率 上 达 
到 令 人 满意 的 程度 。 因 为 这 种 基于 粗 粒 度 的 并 行 计 算 ， 根 本 无 法 高 效 
组 合 所 有 可 用 物理 核心 一 起 进行 并 行 任 务 处理 ， 甚 至 在 某 些 情况 下 ， 
还 有 可 能 导致 部 分 物理 核心 处 于 空闲 的 状态 。 所 以 Java7 版 本 在 
java.util.concurrent.firkjoin 包 下 新 增 了 基于 细 粒 度 的 多 核 并 行 计算 
Fork/Join 框 架 。 该 框架 的 设计 初衷 是 将 一 个 任务 量化 到 最 小 ， 并 提供 高 
计算 密度 的 并 行 处 理性 能 。 简 单 来 说 ， 我 们 可 以 将 一 个 任务 拆 分 成 若 
干 个 子 任务 ， 直 到 这 个 任务 足够 小 ， 然 后 每 一 个 子 任务 被 独立 并 行 计 
算 ， 直 到 任务 执行 完成 ， 再 将 其 逐个 合并 为 一 个 完整 的 任务 ， 这 就 是 
Fork/Join 框 架 提 供 的 细 粒 度 并 行 计 算 模 式 。 

前 面 说 过 ，Fork/Join 框 架 是 Java7 提 供 的 一 个 用 于 并 行 任务 执行 的 
框架 ， 是 把 一 个 大 任务 分 割 成 若干 个 小 任务 ， 最 终 汇 总 每 个 小 任务 结 
果 后 得 到 大 任务 结果 的 框架 。 从 英文 字面 上 也 可 以 理解 ，Fork 就 是 把 
一 个 大 任务 切 分 为 若干 子 任 务 并 行 的 执行 ，Join 就 是 合并 这 些 子 任务 的 
执行 结果 ， 最 后 得 到 这 个 大 任务 的 结果 。 比 如 计算 1+2+...+10000， 可 
以 分 割 为 100 个 任务 ， 每 个 子 任务 分 别 对 100 个 数 进行 求 和 ， 最 终 汇总 
这 10 个 子 任务 的 结果 。 其 原理 如 图 5-3 所 示 。 


Task 0 


Task 0-1 Task 0-2 


Task 0-1-1 Task 0-1-2 Task 0-2-1 Task 0-2-2 Task 0-2-3 


图 5-3 Fork/Join 原 理 图 


Fork/Join 框 架 的 工作 分 为 两 个 步 又: 

(1) 分 割 任务 。 首 先 需 要 有 一 个 fork 类 来 把 大 任务 分 割 成 子 任 
务 ， 有 可 能 子 任务 还 是 很 大 ， 所 以 还 需要 不 停 地 分 割 ， 直 到 分 割 出 的 
子 任务 足够 小 。 

(2) 执行 任务 并 合并 结果 。 分 割 的 子 任务 分 别 放 在 双 端 队列 里 ， 
然后 几 个 启动 线程 分 别 从 双 端 队列 里 获取 任务 执行 。 子 任务 执行 完 的 
结果 都 统一 放 在 一 个 队列 里 ， 启 动 一 个 线程 从 队列 里 拿 数 据 ， 然 后 合 
并 这 些 数 据 。 

Fork/Join 相 关 类 的 类 间 关 系 如 图 5-4 所 示 。 


Executor | 
- 
ForkJoinTask<V> 


A 


AbstractExecutorService 
ForkJoinPool 


RecursiveTask<V> 


图 5-4 Fork/Join 类 图 

Fork/Join 具 体 使 用 两 个 类 来 完成 以 上 两 件 事 情 。 

(1) ForkJoinTask: 我 们 要 使 用 ForkJoin 框 架 ， 必 须 首 先 创建 一 个 
ForkJoin 任 务 。 它 提供 在 任务 中 执行 fork () 和 join O 操作 的 机 制 。 通 
常情 况 下 ， 我 们 不 需要 直接 继承 ForkJoinTask 类 ， 只 需要 继承 它 的 子 
类 ，Fork/Join 框 架 提 供 了 以 下 两 个 子 类 。 

RecursiveAction: 用 于 没有 返回 结果 的 任务 。 

RecursiveTask: 用 于 有 返回 结果 的 任务 。 

(2) ForkJoinPool: ForkJoinTask 需 要 通过 ForkJoinPool 来 执行 。 

任务 分 割 出 的 子 任务 会 添加 到 当前 工作 线程 所 维护 的 双 端 队列 
中 ， 进 入 队列 的 头 部 。 当 一 个 工作 线程 的 队列 里 暂时 没有 任务 时 ， 它 
会 随机 从 其 他 工作 线程 的 队列 的 尾部 获取 一 个 任务 。 

ForkJointask 与 一 般 任务 的 主要 区 别 在 于 它 需 要 事先 调用 compute 方 
法 用 于 计算 ， 在 这 个 方法 里 ， 首 先 需要 判断 任务 是 否 足够 小 ， 如 果 足 
够 小 就 直接 执行 任务 。 如 果 不 足 够 小 ， 就 必须 分 割 成 两 个 子 任务 ， 每 
个 子 任务 在 调用 fork 方 法 时 ， 又 会 进入 compute 方 法 ， 看 看 当前 子 任务 
是 否 需 要 继续 分 割 成 子 任务 ， 如 果 不 需 要 继续 分 割 ， 则 执行 当前 子 任 
务 并 返回 结果 。 使 用 join 方法 会 等 待 子 任务 执行 完 并 得 到 其 结果 。 

ForkJoinPool 由 ForkJoinTask 数组 和 ForkJoinWorkerThread 数组 组 
成 ，ForkJoinTask 数 组 负责 将 存放 程序 提交 给 ForkJoinPool 的 任务 ， 而 
ForkJoinWorkerThread 数 组 负责 执行 这 些 任务 。 

1.ForkJoinTask 的 fork 方 法 实现 原理 

当 我 们 调用 ForkJoinTask 的 fork 方 法 时 ， 程 序 会 调用 
ForkJoinWorkerThread 的 pushTask 方 法 异步 地 执行 这 个 任务 ， 然 后 立即 
返回 结果 。 

pushTask 方 法 把 当前 任务 存放 在 ForkJoinTask 数 组 队列 里 。 然 后 再 
调用 ForkJoinPool 的 signalWork () 方法 唤醒 或 创建 一 个 工作 线程 来 执 
行 任 务 。 

2.ForkJoinTask 的 join 方法 实现 原理 

Join 方 法 的 主要 作用 是 阻塞 当前 线程 并 等 待 获取 结果 。 


首先 ，Join 方 法 会 调用 doJoin () 方法 ， 通 过 doJoin () 方法 得 到 
当前 任务 的 状态 来 判断 返回 什么 结果 ， 任 务 状态 有 4 种 : 已 完成 
(NORMAL) 、 被 取消 (CANCELLED) 、 信 号 (SIGNAL) 和 出 现 
异常 (EXCEPTIONAL) 。 


Fork/Join 的 任务 定义 如 下 例 所 示 。 


代码 清单 5-35 Fork/Join 任务 定义 示例 
public class Calculator extends RecursiveTask<Integer>{ 
private static final int THRESHOLD = 100; 
private int start; 


private int end; 


public Calculator(int start, int end) { 
this.start = start; 
this.end = end; 


} 


QOverride 


protected Integer compute() { 


int sum = 0; 

if((start - end) < THRESHOLD) { 
for(int i = start; i< end;itt) { 
sum += 1; 

} 
Jelse 
int middle = (start + end) /2; 

Calculator left = new Calculator (start, middle); 
Calculator right = new Calculator (middle + 1, end); 
left.fork(); 

right.fork(); 


sum = left.join() + right.join(); 
} 

return sum; 

} 

} 


这 段 代 码 中 ， 定 义 了 一 个 累加 的 任务 ， 在 compnute 方 法 中 ， 判 断 当 
前 的 计算 范围 是 否 小 于 一 个 值 ， 如 果 是 则 计算 ， 如 果 没 有 ， 就 把 任务 
拆 分 为 连 个 子 任务 ， 并 合并 连 个 子 任务 的 中 间 结 果 。 程 序 递归 地 完成 
了 任务 拆 分 和 计算 。 

任务 定义 之 后 就 是 执行 任务 ，Fork/Join 提 供 一 个 和 Executor 框 架 的 
扩展 线程 池 来 执行 任务 ， 代 码 如 下 所 示 。 


代码 清单 5-36 执行 任务 示例 
(Test 


public void run() throws Exception{ 

ForkJoinPool forkJoinPool = new ForkJoinPool(); 

Future<Integer> result = forkJoinPool.submit (new Calculator(0, 10000)); 
assertEquals (new Integer (49995000), result.get()); 

Tag 


为 了 确保 Fork/Join 方 式 可 以 奏效 ，JDK 采 用 工作 窃取 算法 来 保证 多 
个 线程 可 以 访问 多 个 队列 。 

工作 窃取 (work-stealing) 算法 是 指 某 个 线程 从 其 他 队列 里 窃取 任 
务 来 执行 。 那 么 为 什么 需要 使 用 工作 窃取 算法 呢 ? 假如 我 们 需要 做 一 
个 较 大 的 任务 ， 可 以 把 这 个 任务 分 割 为 若干 互 不 依赖 的 子 任务 ， 为 了 
减 。 少 线程 间 的 竞争 ， 把 这 些 子 任务 分 别 放 到 不 同 的 队列 里 ， 并 为 每 个 
队列 创建 一 个 单独 的 线程 来 执行 队列 里 的 任务 ， 线 程 和 队列 一 一 对 
应 。 比 如 A 线程 负责 处 理 A 队 列 里 的 任务 。 但 是 ， 有 的 线程 会 先 把 自己 
队列 里 的 任务 干 完 ， 而 其 他 线程 对 应 的 队列 里 可 能 当时 还 有 任务 等 竺 
处 理 。 这 样 干 完 活 的 队列 只 能 等 着 ， 还 不 如 去 帮 其 他 繁忙 的 线程 干 
活 。 而 在 这 时 它们 会 访问 同一 个 队列 ， 所 以 为 了 减少 窃取 任务 线程 和 
被 窃取 任务 线程 之 间 的 竞争 ， 通 常会 使 用 双 端 队列 ， 被 窃取 任务 线程 
永远 从 双 端 队列 的 头 部 拿 任 务 执行 ， 而 窃取 任务 的 恶 线程 永远 从 双 端 
队列 的 尾部 拿 任 务 执行 。 工 作 窃取 的 流程 图 如 图 5-5 所 示 。 


图 5-5 工作 窃取 流程 图 


工作 窃取 算法 的 优点 是 它 能 够 充分 利用 线程 进行 并 行 计算 ， 减 少 
了 线程 间 的 竞争 。 缺 点 是 在 有 示 些 情况 下 还 是 存在 竞争 ， 比 如 双 端 队列 
里 只 有 一 个 任务 时 。 并 且 该 算法 会 消耗 更 多 的 系统 资产 ， 比 如 创建 多 
个 线程 和 多 个 双 端 队列 。 


除了 Java7 能 够 高 效 地 利用 Fork/Join 框 架 实现 多 核 并 行 计算 外 ， 开 
源 基金 会 Apache 提 供 的 Hadoop MapReduce 框 架 也 是 一 个 高 效 的 海量 数 
据 计算 框架 ， 它 允许 开发 人 员 将 其 部 署 在 廉价 的 集群 服务 器 上 处 理 TB 
级 别 的 数据 。 当 然 还 有 一 些 编程 语言 自 诞 生 那 天 起 ， 就 是 为 了 解决 并 
行 计算 而 来 ， 比 如 Scala、Clojure 和 Erlang 等 。 这 类 编程 语言 ， 不 仅 继 承 
了 面向 对 象 的 特性 ， 同 时 还 结合 了 函数 式 编程 等 特性 。 虽 然 目 前 Java 同 
样 也 可 能 够 使 用 函数 式 编程 ， 但 代码 将 会 显得 非常 见 余 ， 不 过 Java 设 计 
者 们 在 Java8 种 提供 对 Lambda 的 支持 ， 这 极 大 地 改善 了 Java 对 于 遂 数 式 
编程 的 不 足 。 


5.3.5 Executor 框 架 


在 Java 中 ， 使 用 线程 来 异步 执行 任务 。Java 线 程 的 创建 与 销毁 需要 
一 定 的 开销 ， 如 果 我 们 为 每 一 个 任务 创建 一 个 新 线程 来 执行 ， 这 些 线 
程 的 创建 与 销毁 将 消耗 大 量 的 计算 资源 。 同 时 ， 为 每 一 个 任务 创建 一 
个 新 线程 来 执行 ， 这 种 策略 可 能 会 使 处 于 高 负荷 状态 的 应 用 最 终 奔 

Java 的 线程 既是 工作 单元 ， 也 是 执行 机 制 。 从 JDK5 开 始 ， 把 工作 
单元 与 执行 机 制 分 离开 来 。 工 作 单 元 包括 Runnable 和 Callable， 而 执行 
机 制 由 Executor 框 架 提供 。 

在 HotSpot VM 的 线程 模型 中 ，Java 线 程 被 一 对 一 映射 为 本 地 操作 
系统 线程 。Java 线 程 启动 时 会 创建 一 个 本 地 操作 系统 线程 ， 当 该 Java 线 
程 被 终止 时 ， 这 个 操作 系统 线程 也 会 被 回收 。 操 作 系 统 会 调度 所 有 线 
程 并 将 它们 分 配给 可 用 的 CPU。 在 上 层 ，Java 多 线程 程序 通常 把 应 用 分 
解 为 若干 个 任务 ， 然 后 使 用 用 户 级 的 调度 器 (ExecutorfEZg) 将 这 些 任 
务 映 射 为 固定 数量 的 线程 ; 在 底层 ， 操 作 系统 内 核 将 这 些 线程 映射 到 
硬件 处 理 器 上 。 

Executor 框 架 主要 由 3 大 部 分 组 成 。 

m 任务 : 包括 被 执行 任务 需要 实现 的 接口 ，Runnable 接 口 或 
Callable 接 口 。 

m 任务 的 执行 : 包括 任务 执行 机 制 的 核心 接口 Executor， 以 及 继承 
自 Executor 的 ExecutorService 接口 。Executor 框架 有 两 个 关键 类 实现 了 


ExecutorService 接 口 ( ThreadPoolExecutor 和 
ScheduleThreadPoolExecutor) 。 


m 异步 计算 的 结果 : 包括 接口 Future 和 实现 Future 接 口 的 FutureTask 


类 。 


Executor 是 一 个 接口 ， 它 是 Executor 框 架 的 基础 ， 它 将 任务 的 提交 
与 任务 的 执行 分 离开 来 。 

ThreadPoolExecutor 是 线程 池 的 核心 实现 类 ， 用 来 执行 被 提交 的 任 
务 。 

ScheduledThreadPoolExecutor 是 一 个 实现 类 ， 可 以 在 给 定 的 延迟 后 
运行 命令 ， 或 者 定期 执行 命令 。ScheduledThreadPoolExecutor 比 Timer 更 
灵活 ， 功 能 更 强大 。 

Future 接 口 和 实现 Future 接 口 的 FutureTask 类 ， 代 表 异 步 计 算 的 结 
果 。 

Runnable 接口 和 Callable 接口 的 实现 类 ， 都 可 以 被 
ThreadPoolExecutor 或 ScheduledThreadPoolExecutor 执 行 。 

主线 程 首先 把 要 创建 实现 Runnable 或 者 Callable 接 口 的 任务 对 象 。 
工具 类 Executors 可 以 把 一 个 Runnable 对 象 封装 为 一 个 Callable 对 象 。 然 
后 可 以 把 Runnable 对 象 直接 交 给 ExecutorService 执 行 ， 或 者 也 可 以 把 
Runnable 对 象 或 Callable 对 象 提 交 给 ExecutorService 执 行 。 如 果 执 行 
ExecutorService.submit () ，ExecutorService 将 返回 一 个 实现 Future 接 口 
的 对 象 。 由 于 FutureTask 实现 了 Runnable ， 程 序 员 也 可 以 创建 
FutureTask， 然 后 直接 交 给 ExecutorService 执 行 。 最 后 ， 主 线程 可 以 执 
行 FutureTask.get () 方法 来 等 待 任务 执行 完成 。 主 线程 也 可 以 执行 
FutureTask.cancel 来 取消 任务 的 执行 。 

ThreadPoolExecutor: 通常 使 用 工厂 类 Executors 创 建 。Executors 可 
以 创建 3 种 类 型 的 ThreadPoolExecutor ， 即 SingleThreadExecutor 、 
FixedThreadPool 和 CachedThreadPool。 


(1) FixedThreadPool， 创 建 使 用 固定 线程 数 的 Executors。 适 用 于 
为 了 满足 资源 管理 的 需求 ， 而 需要 限制 当前 线程 数量 的 应 用 场景 ， 它 
适用 于 负载 比较 重 的 服务 器 。 


(2) SingleThreadExecutor , 用 于 创建 单个 线程 的 
SingleThreadExecutor， 适 用 于 需要 保证 顺序 执行 各 个 任务 ， 并 且 在 任 
意 时 间 点 ， 不 会 有 多 个 线程 是 活动 的 应 用 场景 。 

(3) CachedThreadPool, ， 创 建 一 个 会 根据 需要 创建 新 线程 的 
CachedThreadPool， 它 是 大 小 无 界 的 线程 闻 ， 适 用 于 执行 很 多 的 短期 异 
步 任 务 的 小 程序 ， 或 者 是 负载 较 轻 的 服务 器 。 


5.4 JDK 类 库 使 用 


并 行程 序 开发 经 常 提 到 线程 安全 ， 什 么 叫 线程 安全 ?这 个 首先 要 
明确 。 线 程 安全 就 是 说 多 线程 访问 同一 代码 ， 不 会 产生 不 确定 的 结 
果 。 

其 次 我 们 需要 明确 并 行 和 并 发 区 别 ， 如 下 所 示 。 

(1) 并 行 是 指 两 者 同时 执行 一 件 事 ， 比 如 赛跑 ， 两 个 人 都 在 不 停 
地 往 前 跑 。 

(2) 并 发 是 指 资源 有 限 的 情况 下 ， 两 者 交替 轮流 使 用 资源 ， 比 如 
一 段 路 〈 单 核 CPU 资源 ) 同时 只 能 过 一 个 人 ，A 走 一 段 后 ， 让 给 B，B 
用 完 继续 给 A， 交 蔡 使 用 ， 目 的 是 提高 效率 。 


5.4.1 原子 值 


原子 操作 是 不 可 被 中 断 的 一 个 或 一 系列 操作 。 在 多 处 理 器 上 实现 
原子 操作 就 变 得 有 点 复杂 。 从 Java5 开 始 ，java.util.concurrent.atomic 包 
提供 了 用 于 支持 无 锁 可 变 变量 的 类 。 例 如 ，AtomicLong 是 作用 是 对 长 
整形 进行 原子 操作 。 在 32 位 操作 系统 中 ，64 位 的 long 和 double 变量 由 
会 被 JVM 当 作 两 个 分 离 的 32 位 来 进行 操作 ， 所 以 不 具有 原子 性 。 而 
使 用 AtomicLong 能 让 long 的 操作 保持 原子 型 。 
例如 ， 你 可 以 用 如 下 代码 完全 地 生成 一 组 数字 。 


代码 清单 5-37 ”生成 一 组 数字 
public static AtomicLong nextNumber = new AtomicLong(); 


long id = nextNumber.incrementAndGet () ; 


incrementAndGet 方 法 会 自动 将 AtomicLong 的 值 加 1， 并 返回 增加 后 
的 值 。 即 该 操作 会 获得 它 的 值 ， 增 加 1， 再 将 增加 后 的 值 设置 给 它 ， 并 
且 产 生 新 值 的 过 程 不 能 被 打 断 。 它 可 以 保证 即便 有 多 个 线程 同时 并 发 
访问 同一 个 实例 ， 也 能 够 计算 并 返回 正确 的 值 。 

Java5 中 提供 了 很 多 设置 、 增 加 、 减 少 值得 原子 操作 ， 但 是 如 果 想 
要 进行 更 复杂 的 更 新 操作 ， 就 必须 使 用 compareAndSset 方 法 。 例 如 ， 假 
设 你 想 要 追踪 由 不 同 线程 所 检测 的 最 大 值 ， 那 么 下 面 的 代码 就 不 行 
Ta 


代码 清单 5-38 错误 的 代码 
public static AtomicLong largest = new AtomicLong(); 
| EXER T... 
largest.set (Math.max (largest.get () , observed) ) ; // 错 误 -竞争 条 件 | 


这 个 更 新 过 程 不 是 原子 性 。 相 反 ， 应 该 在 一 个 循环 中 使 用 
compareAndSet 来 计算 新 值 。 


代码 清单 5-39 使 用 compareAndSet 方法 
do{ 
oldValue = largest.get(); 
newValue = Math.max (oldValue, observed) ; 


}while(!largest.compareAndSet (oldValue, newValue) ) ; 


如 果 另 一 个 线程 也 在 更 新 largest， 很 可 能 它 已 经 捷足先登 更 新 成 功 
了 。 那 么 随后 compareAndSet 会 返回 false， 并 且 不 会 设置 新 值 。 此 时 ， 
程序 会 再 次 尝试 循环 ， 读 取 更 新 后 的 值 并 试图 改变 它 。 最 终 ， 它 成 功 


地 将 已 有 值 蔡 换 为 了 新 的 值 。compareAndSset 方 法 会 映射 为 一 个 底层 的 
处 理 器 方法 ， 这 远 比 使 用 一 个 锁 要 快 得 多 。 

在 Java8 中 不 必 再 编写 循环 逻辑 。 只 需要 提供 一 个 用 来 更 新 值得 
lambda 表 达 式 ， 更 新 操作 就 会 自动 完成 。 在 我 们 的 操作 中 ， 可 以 调 
用 。 


代码 清单 -40 Java8 方式 
largest .updateAndGet (x->Math.max (x, observed) ) ; 


largest.accumulateAndGet (observed, Math: :max) ; 


AccumulateAndGet 方 法 通过 一 个 二 元 运算 符 将 原子 值 传 入 的 参数 
组 合 起 来 。 

除了 它 之 外 ，Java8 还 提供 了 返回 原始 值得 getAndUpdate 方 法 和 
getAndAccumulate 方 法 。 


注 意 。 AtomicInteger — . AtomicIntegerArray — « 
AtomicIntegerFieldUpdater — . AtomicLongArray 、 Atomic- 
LongFieldUpdater . AtomicReference 、 AtomicReferenceArray 和 
AtomicReferenceFieldUpdater 类 都 提供 了 这 些 方 法 。 

当 你 有 大 量 线程 访问 同一 个 原子 值 时 ， 由 于 乐观 锁 更 新 需要 太 多 
次 重 试 ， 因 此 会 导致 性 能 严重 下 降 。 为 此 ，Java8 提 供 了 LongAdder 和 
LongAccumulator 来 解决 该 问题 。LongAdder 由 多 个 变量 组 成 ， 这 些 变 
量 累加 的 值 即 为 当前 值 。 多 个 线程 可 以 更 新 不 同 的 被 加 数 ， 当 线程 数 
量 增加 时 自动 增加 新 的 被 加 数 。 由 于 通常 情况 下 都 是 直到 所 有 工作 完 
成 后 才 需 要 总 和 值 ， 所 以 这 种 方法 效率 很 高 ， 它 所 带 来 的 性 能 提升 十 
分 可 观 。 

如 果 你 的 环境 中 存在 高 度 竞争 ， 那 么 就 应 当 用 LongAdder 来 代替 
AtomicLong。 二 者 之 间 的 方法 命名 稍 有 不 同 。Increment 方 法 用 来 将 计 
数 器 自 增 1，add 方 法 用 来 加 上 某 个 数值 ，sum 方 法 用 来 获取 总 和 值 。 


代码 清单 5-41 LongAdder 方式 
final LongAdder adder = new LongAdder(); 
for (..) 
pool.submit ( () ->{ 
while (..) { 


if (...) adder. increment (); 


); 
long total = adder.sum()); 


注意 : increment 方 法 不 会 返回 原始 值 。 使 用 它 只 会 抹杀 将 总 和 值 
拆 分 为 多 个 被 加 数 所 带 来 的 性 能 提升 。 

AtomicLong 的 实现 方式 是 内 部 有 个 value 变量 ， 当 多 线程 并 发 自 
增 ， 自 减 时 ， 均 通过 cas 指令 从 机 器 指令 级 别 操作 保证 并 发 的 原子 性 。 

LongAccumulator 将 这 个 思想 带 到 了 任意 的 累加 操作 中 。 在 构造 函 
数 中 ， 你 需要 提供 操作 类 型 及 其 中 立 元 素 。 要 与 新 值 相 加 ， 需 要 调用 
accumulate 方 法 。 然 后 再 调用 get 方 法 来 获取 当前 值 。 以 下 代码 与 
LongAdder 的 效果 是 一 样 的 。 


代码 清单 5-42 LongAccumulator 方式 
LongAccumulator adder = new LongAccumulator (Long: :sum, 0) ; 
| EXEAT 


adder.accumulator (value); 


在 LongAccumulator 的 内 部 ， 包 含 al ，a2，...an 等 多 个 变量 。 每 个 
变量 都 被 初始 化 为 中 立 元 素 (在 我 们 的 例子 中 即 为 0) o 

当 调 用 accumulate 方 法 累加 值 Y 时 ， 这 些 变 量 其 中 之 一 会 自动 被 更 
新 为 ai=aiopv， 其 中 op 是 以 中 缀 形式 表示 的 累加 操作 。 在 我 们 的 示例 


中 ， 调 用 accumulate 会 对 某 个 变量 i 计算 ai=aitv。 


Java8 中 还 添加 了 一 个 StampedLock 类 ， 它 用 来 实现 乐观 读 。 首 先 调 
用 tryOptimisticRead 方 法 ， 此 时 会 获得 一 个 “ 印 戳 ”。 然 后 你 读 取 值 并 检 
查 “ 印 戳 ” 是 否 仍然 有 效 〈 例 如 ， 没 有 其 他 线程 已 经 获得 了 一 个 写 
锁 ) 。 如 果 有 效 ， 你 就 可 以 使 用 这 个 值 ; 如 果 无 效 ， 你 会 获得 一 个 读 
S 〈 它 将 会 阻塞 所 有 的 写 锁 ) 。 有 具体 示例 如 下 所 示 。 


代码 清单 5-43 StampedLock 使 用 示例 


import java.util.concurrent.locks.StampedLock; 


public class StampedLockDemo { 
private int size; 
private Object[] elements; 


private StampedLock lock = new StampedLock(); 


public Object get(int n) { 

long stamp = lock.tryOptimisticRead () ; 

Object[] currentElements = elements; 

int currentSize = size; 

if (!lock. validate (stamp) ) (/ / & PRERA 1 —^ E 
stamp = lock.readLock() ; / / &4$— ^ LJ 
currentElements - elements; 
currentSize = size; 
lock.unlockRead (stamp); 

} 


return n € currentSize ? currentElements [n]:null; 


public static void main(String[] args) { 
StampedLockDemo stampedLock = new StampedLockDemo () ; 
stampedLock.get (3) ; 


处 理 器 通过 以 下 几 个 步骤 来 使 用 原子 操作 。 

(1) 使 用 总 线 锁 保 证 原子 性 : 如 果 多 个 处 理 器 同时 对 共享 变量 进 
行 读 改 写 操 作 ， 那 么 共享 变量 就 会 被 多 个 处 理 器 同时 进行 操作 ， 这 样 
读 改写 操作 就 不 是 原子 的 ， 操 作 完 之 后 共享 变量 的 值 会 和 期 望 的 不 一 
致 。 举 个 例子 ， 如 果 i=1， 我 们 进行 两 次 it+ 操 作 ， 期 望 的 结果 是 3， 但 
是 有 可 能 结果 是 2。 原 因 可 能 是 多 个 处 理 器 同时 从 各 自 的 缓存 中 读 取 变 
量 i， 分 别 进行 加 1 操作 ， 然 后 分 别 写 入 系统 内 存 中 。 那 么 ， 想 要 保证 读 
改写 共享 变量 的 操作 是 原子 的 ， 就 必须 保证 CPU1 读 改写 共享 变量 的 时 
候 ，CPU2 不 能 操作 缓存 了 该 共享 变量 内 存 地 址 的 缓存 。 处 理 器 使 用 总 
线 锁 来 解决 这 个 问题 。 所 谓 总 线 锁 就 是 使 用 处 理 器 提供 的 一 个 LOCK# 
信号 ， 当 一 个 处 理 器 在 总 线 上 输出 此 信号 时 ， 其 他 处 理 器 的 请 求 将 被 
阻塞 住 ， 那 么 该 处 理 器 可 以 独占 共享 内 存 。 

(2) 使 用 缓存 锁 保证 原子 性 : 在 同一 时 刻 ， 我 们 只 需 保 证 对 某 个 
内 存 地 址 的 操作 是 原子 性 即 可 ， 但 总 线 锁定 把 CPU 和 内 存 之 间 的 通信 
锁 住 了 ， 这 使 得 锁定 期 间 ， 其 他 处 理 器 不 能 操作 其 他 内 存 地 址 的 数 
据 ， 所 以 总 线 锁 定 的 开销 比较 大 ， 目 前 处 理 器 在 某 些 场合 下 使 用 缓存 
锁定 代替 总 线 锁定 来 进行 优化 。 

频繁 使 用 的 内 存 会 缓存 在 处 理 器 的 L1、L2 和 L3 高 速 缓存 里 ， 那 么 
原子 操作 就 可 以 直接 在 处 理 器 内 部 缓存 中 进行 ， 而 不 需要 申明 总 线 
锁 。 所 谓 “ 缓 存 锁定 ”是 指 内 存 区 域 如 果 被 缓存 在 处 理 器 的 缓存 行 中 ， 
并 且 在 LOCK 操 作 期 间 被 锁定 ， 那 么 当 它 执行 锁 操 作 回 写 到 内 存 时 ， 处 
理 器 不 在 总 线 上 声言 LOCK 直 信号 ， 而 是 修改 内 部 的 内 存 地 址 ， 并 人 允许 
它 的 缓存 一 致 性 机 制 来 保证 操作 的 原子 性 ， 因 为 缓存 一 致 性 机 制 会 阻 
止 同 时 修改 由 两 个 以 上 处 理 器 缓存 的 内 存 区 域 数 据 ， 当 其 他 处 理 器 回 
写 已 被 锁定 的 缓存 行 的 数据 时 ， 会 使 缓存 行 无 效 。 

有 两 种 情况 处 理 器 不 会 使 用 缓存 锁定 : 

(1) 当 操 作 的 数据 不 能 被 缓存 在 处 理 器 内 部 ， 或 操作 的 数据 跨 多 
个 缓存 行 (cache line) 时 ， 则 处 理 器 会 调用 总 线 锁 定 。 

(2) 有 些 处 理 器 不 支持 缓存 锁定 。 

CAS 实 现 原子 操作 的 三 大 问题 

在 Java 并 发 包 中 有 一 些 并 发 框架 也 使 用 了 自 旋 CAS 的 方式 来 实现 原 
子 操作 。 比 如 LinkedTransferQueue 类 的 Xfer 方 法 。CAS 虽 然 很 高 效 地 解 


决 了 原子 操作 ， 但 是 CAS 仍 然 存 在 三 大 问题 。 

(1) ABA 问 题 。 因 为 CAS 需 要 在 操作 值 的 时 候 ， 检 查 值 有 没有 发 
生变 化 ， 如 果 没 有 发 生变 化 则 更 新 ， 但 是 如 果 一 个 值 原 来 是 A， 变 成 了 
B， 又 变 成 了 A， 和 那么 使 用 CAS 进 行 检 查 时 会 发 现 它 的 值 没 有 发 生变 
化 ， 但 是 实际 上 却 变 化 了 。ABA 问题 的 解决 思路 就 是 使 用 版 本 号 。 在 
变量 前 面 追加 了 版 本 号 ， 每 次 变量 更 新 的 时 候 把 版 本 号 加 1， 那 么 A- > 
B->A 就 会 变 成 1A-> 2B->3A。 从 Java5 开 始 ，Atomic 包 里 提供 
了 一 个 雷 AtomicStampedReference 来 解决 ABA 问 题 。 这 个 类 的 
compareAndSet 方 法 的 作用 是 首先 检查 当前 引用 是 否 等 于 预期 引用 ， 并 
且 检 查 当 前 标志 是 否 等 于 预期 标志 ， 如 果 全 部 相等 ， 则 以 原子 方式 将 
该 引用 和 该 标志 的 值 设置 为 给 定 的 更 新 值 。 

(2) 循环 时 间 长 、 开 销 大 : 自 旋 CAS 如 果 长 时 间 不 成 功 ， 会 给 
CPU 带 来 非常 大 的 执行 开销 。 如 果 JVM 能 支持 处 理 器 提供 的 pause 指 
令 ， 那 么 效率 会 有 一 定 的 提升 。pause 指 令 有 两 个 作用 : 第 一 ， 它 可 以 
延迟 流水 线 执行 指令 ， 使 CPU 不 会 消耗 过 多 的 执行 资源 ， 延 迟 的 时 间 
取决 于 具体 实现 的 版 本 ， 在 一 些 处 理 器 上 延迟 时 间 是 零 ; 第 二 ， 它 可 
以 避免 在 推出 循环 的 时 候 因 内 存 顺 序 冲 突 (Memory order Violation) 而 


引起 CPU 流水 线 被 清空 (CPU Pipeline Flush) ， 从 而 提高 CPU 的 执行 效 
xx 


(3) 只 能 保证 一 个 共享 变量 的 原子 操作 。 当 对 一 个 共享 变量 执行 
操作 时 ， 我 们 可 以 使 用 循环 CAS 的 方式 来 保证 原子 操作 ， 但 是 对 多 个 
共享 变量 操作 时 ， 循环 CAS 就 无 法 保证 操作 的 原子 性 ， 这 个 时 候 就 可 
以 使 用 锁 。 


5.4.2 并 行 容器 


5.4.2.1 ConcurrentHashMap 

在 多 线程 环境 中 使 用 Map ， 一 般 也 可 以 使 用 Collections 的 
synchronizedMap () 方法 得 到 一 个 线程 安全 的 Map。 但 是 在 高 并 发 的 
情况 ， 这 个 Map 的 性 能 表现 不 是 最 优 的 。 由 于 Map 是 使 用 相当 频繁 的 一 
个 数据 结构 ， 因 此 JDK 中 便 提供 了 一 个 专用 于 高 并 发 的 Map 实 现 


ConcurrentHashMapo 


ConcurrentHashMap 是 Java5 中 支持 高 并 发 、 高 否 吐 量 的 线程 安全 
HashMap 实 现 。HashMap 是 非 线 程 安全 的 ，ConcurrentHashMap 具 体 是 
怎么 实现 线程 安全 的 呢 ， 肯 定 不 可 能 是 每 个 方法 加 synchronized， 那 样 
就 变 成 了 HashTable。 ConcurrentHashMap 人 允许 多 个 修改 操作 并 发 进行 ， 
其 关键 在 于 使 用 了 锁 分 离 技 术 。 锁 分 离 技 术 使 用 了 多 个 锁 来 控制 对 
Hash 表 的 不 同 部 分 进行 的 修改 。 ConcurrentHashMap 内 部 使 用 段 

(Segment) 来 表示 这 些 不 同 的 部 分 ， 每 个 段 其 实 就 是 一 个 小 的 Hash 
Table, £f ]855 E CHM. E8222 ME PETER ETE IBIBJE E, € 
们 就 可 以 并 发 进行 。 通 过 把 整个 Map 3 73N f Segment. (类 似 
HashTable) ， 可 以 提供 相同 的 线程 安全 ， 但 是 效率 提升 N 倍 ， 默 认 提 
升 16 倍 。 

有 些 方法 需要 跨 段 ， 比 如 size () 和 containsValue () ， 它 们 可 能 
需要 锁定 整个 表 而 不 仅仅 是 某 个 段 ， 这 需要 按 顺 序 锁定 所 有 段 ， 操 作 
完毕 后 ， 又 按 顺序 释 放 所 有 段 的 锁 。 这 里 * 按 顺序 ”是 很 重要 的 ， 否 则 
极 有 可 能 出 现 死 锁 ， 在 ConcurrentHashMap 内 部 ， 段 数组 是 final 的 ， 并 
且 其 成 员 变 量 实际 上 也 是 final 的 ， 但 是 ， 仅 仅 是 将 数组 声明 为 final 的 并 
不 能 保证 数组 成 员 也 是 final 的 ， 这 需要 实现 上 的 保证 ， 下 面 是 段 的 不 变 
性 声明 。 这 样 做 的 好 处 是 可 以 确保 使 用 过 程 中 不 会 出 现 死 锁 ， 因 为 获 
得 锁 的 顺序 是 固定 的 。 不 变性 使 多 线程 编程 占有 很 重要 的 地 位 。 


代码 清单 5-44 不 变性 定义 
/** 
* The segments, each of which is a specialized hash table 
*/ 


final Segment<K,V>[] segments; 


ConcurrentHashMap 完 全 允许 多 个 读 操 作 并 发 进行 ， 读 操作 并 不 需 
要 加 锁 。 如 果 使 用 传统 的 技术 ， 如 HashMap 中 的 实现 ， 如 果 人 允许 可 以 
在 Hash 链 的 中 间 添 加 或 删除 元 素 ， 读 操作 不 加 锁 将 得 到 不 一 致 的 数 
据 。ConcurrentHashMap 实 现 技术 是 保证 HashEntry 几 乎 是 不 可 变 的 。 
HashEntry 代 表 每 个 Hash 链 中 的 一 个 节点 ， 其 结构 如 下 所 示 。 


代码 清单 5-45 HashEntry 实现 
static final class HashEntry<K,V> { 
final K key; 
final int hash; 
volatile V value; 
final HashEntry<K,V> next; 
} 


可 以 看 到 除了 value 不 是 final 的 ， 其 他 值 都 是 final 的 ， 这 意味 着 不 能 
从 hash 链 的 中 间或 尾部 添加 或 删除 节点 ， 因 为 这 需要 修改 next 引 用 值 ， 
所 有 的 节点 的 修改 只 能 从 尖 部 开始 。 对 于 put 操 作 ， 可 以 一 Ec. 
ee 部 。 但 是 对 于 remove 操 作 ， 可 能 需要 从 中 间 删 除 一 

， 这 就 需要 将 要 删除 节点 的 前 面 所 有 节点 整个 复制 一 遍 ， 最 后 一 
NET 个 结 点 。 这 在 讲解 删除 操作 时 ae 
为 了 确保 读 操作 能 够 看 到 最 新 的 值 ， 将 value 设 置 成 volatile， 这 避免 了 
加 锁 。 

为 了 加 快 定位 段 以 及 段 中 hash 槽 的 速度 ， 每 个 段 hash 槽 的 个 数 都 是 
2An， 这 使 得 通过 位 运算 就 可 以 定位 段 和 上段 中 hash 槽 的 位 置 。 当 并 发 级 
别 为 默认 值 16 时 ， 也 就 是 段 的 个 数 ，hash 值 的 高 4 位 决定 分 配 在 哪个 段 
中 。 但 是 "i me 《算法 导论 》 给 我 们 的 教训 : hash 槽 的 个 数 不 
应 该 是 2An， 这 可 能 导致 hash 模 分 配 不 均 ， 这 需要 对 hash 值 重新 再 hash 
一 次 。 uu a 


代码 清单 5-46 Hash 实现 代码 
private static int hash(int h) { 
// Spread bits to regularize both segment and index locations, 
// using variant of single-word Wang/Jenkins hash. 
h += (h << 15) ^ Oxffffcd7d; 


h ^2 (h >>> 10); 
h t= (h«« 3); 
“s= (h SS 6); 


h += (h << 2) + (h << 14); 
return h ^ (h >>> 16); 
} 


Hash 表 的 一 个 很 重要 方面 就 是 如 何 解 决 hash 冲 突 ， 
ConcurrentHashMap 和 HashMap 使 用 相同 的 方式 ， 都 是 将 hash 值 相同 的 
节点 放 在 一 个 hash 链 中 。 与 HashMap 不 同 的 是 ，ConcurrentHashMap 使 
用 多 个 子 Hash 表 ， 也 就 是 段 (Segment) 。 下 面 是 ConcurrentHashMap 
的 数据 成 员 。 


代码 清单 5-.47 ConcurrentHashMap 数据 成 员 
public class ConcurrentHashMap«K, V» extends AbstractMap<K, V> 
implements ConcurrentMap«K, V>, Serializable { 

/[** 
* Mask value for indexing into segments. The upper bits of a 
* key's hash code are used to choose the segment. 
final int segmentMask; 
/* * 
* Shift value for indexing within segments. 
vj 
final int segmentShift; 
/[** 
* The segments, each of which is a specialized hash table 
i 
final Segment<K,V>[] segments; 


} 


所 有 的 成 员 都 是 Final 的 ， 其 中 segmentMask 和 segmentShift 主 要 是 
为 了 定位 段 ， 参 见 上 面 的 segmentFor 方 法 。 每 个 Segment 相 当 于 一 个 子 
Hash 表 ， 它 的 数据 成 员 如 下 所 示 。 


代码 清单 5-48 数据 成 员 
static final class Segment«K,V» extends ReentrantLock implements Serializable{ 
private static final long serialVersionUID = 2249069246763182397L; 
/** 
* The number of elements in this segment's region. 
*/ 
transient volatile int count; 
/** 
* Number of updates that alter the size of the table. This is 
* used during bulk-read methods to make sure they see a 
* consistent snapshot: If modCounts change during a traversal 
* of segments computing size or checking containsValue, the 
* we might have an inconsistent view of state so (usually) 
* must retry. 
i 
transient int modCount; 
[** 
* The table is rehashed when its size exceeds this threshold. 
* (The value of this field is always «tt»(int) (capacity * 
* loadFactor)</tt>.) 
"f 
transient int threshold; 
/** 
* The per-segment table. 
*/ 
transient volatile HashEntry<K,V>[] table; 
/** 
* The load factor for the hash table. Even though this value 
* is same for all segments, it is replicated to avoid needing 
* links to outer object. 
* Qserial 
a 
final float loadFactor; 


count 用 来 统计 该 段 数据 的 个 数 ， 它 是 volatile， 它 用 来 协调 修改 和 
读 取 操作 ， 以 保证 读 取 操作 能 够 读 取 到 几乎 最 新 的 修改 。 协 调 方 式 是 
这 样 的 ， 每 次 修改 操作 做 了 结构 上 的 改变 ， 如 增加 /删除 节点 (修改 节 
点 的 值 不 算 结 构 上 的 改变 ) ， 都 要 写 count 值 ， 每 次 读 取 操作 开始 都 要 
读 取 count 的 值 。 这 利用 了 Java5 中 对 volatile 语 义 的 增强 ， 对 同一 个 
volatile 变 量 的 写 和 读 存 在 happens-before 关 系 。modCount 统 计 上段 结 构 改 
变 的 次 数 ， 主 要 是 为 了 检测 对 多 个 段 进行 遍历 过 程 中 某 个 段 是 否 发 生 
改变 ， 在 讲述 跨 段 操作 时 会 还 会 详 述 。threashold 用 来 表示 需要 进行 
rehash 的 界限 值 。table 数 组 存储 段 中 节点 ， 每 个 数组 元 素 是 个 hash 链 ， 
用 HashEntry 表 示 。table 也 是 volatile， 这 使 得 能 够 读 取 到 最 新 的 table 值 
而 不 需要 同步 。loadFactor 表 示 负 载 因子 。 

ConcurrentHashMap 的 整个 删除 操作 是 在 持 有 段 锁 的 情况 下 执行 
的 ， 空 白 行 之 前 的 行 主要 是 定位 到 要 删除 的 节点 e。 接 下 来 ， 如 果 不 存 


在 这 个 节点 就 直接 返回 null， 否 则 就 要 将 e 前 面 的 结 点 复制 一 遍 ， 尾 结 
点 指向 e 的 下 一 个 结 点 。e 后 面 的 结 点 不 需要 复制 ， 它 们 可 以 重用 。 


删除 元 素 之 前 如 图 5-6 所 示 。 


Before deletion of element 3 
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图 5-6 删除 元 素 前 
删除 元 素 3 之 后 如 图 5-7 所 示 。 


New (cloned) chain, joined to tail of existing chain 


Old head of chain, will be garbage collected 
ITN: [4 
图 5-7 删除 元 素 后 


整个 remove 实 现 并 不 复杂 ， 但 是 需要 注意 如 下 几 点 。 第 一 ， 当 要 
删除 的 结 点 存在 时 ， 删 除 的 最 后 一 步 操作 要 将 count 的 值 减 一 。 这 必须 


是 最 后 一 步 操 作 ， 否 则 读 取 操作 可 能 看 不 到 之 前 对 段 所 做 的 结构 性 修 
改 。 第 二 ，remove 执 行 的 开始 就 将 table 赋 给 一 个 局 部 变量 tab， 这 是 因 
为 table 是 volatile 变 量 ， 读 写 volatile 变 量 的 开销 很 大 。 编 译 器 也 不 能 对 
volatile 变 量 的 读 写 做 任何 优化 ， 直 接 多 次 访问 非 volatile 实 例 变量 没 
多 大 影响 ， 编 译 器 会 做 相应 优化 。 

ConcurrentHashMap 的 get 操 作 不 需要 锁 。 第 一 步 是 访问 count 变 量 ， 
这 是 一 个 volatile 变 量 ， 由 于 所 有 的 修改 操作 在 进行 结构 修改 时 都 会 在 
最 后 一 步 写 count 变 量 ， 通 过 这 种 机 制 保证 get 操 作 能 够 得 到 几乎 最 新 的 
结构 更 新 。 对 于 非 结构 更 新 ， 也 就 是 结 点 值 的 改变 ， 由 于 HashEntry 的 
value 变 量 是 volatile 的 ， 也 能 保证 读 取 到 最 新 的 值 。 接 下 来 就 是 对 hash 
链 进 行 遍历 找到 要 获取 的 结 点 ， 如 果 没 有 找到 ， 直 接 访 回 null。 对 hash 
链 进 行 遍 历 不 需要 加 锁 的 原因 在 于 链 指针 next 是 final 的 。 但 是 头 指针 却 
不 是 final 的 ， 这 是 通过 getFirst (hash) 方法 返回 ， 也 就 是 存在 table 数 组 
中 的 值 。 这 使 得 getFirst (hash) 可 能 返回 过 时 的 头 结 点 ， 例 如 ， 当 执 
行 get 方 法 时 ， 刚 执行 完 getFirst (hash) 之 后 ， 另 一 个 线程 执行 了 删除 
操作 并 更 新 头 结 点 ， 这 就 导致 get 方 法 中 返回 的 头 结 点 不 是 最 新 的 。 这 
是 可 以 人 允许， 通过 对 count 变 量 的 协调 机 制 ，get 能 读 取 到 几乎 最 新 的 数 
据 ， 虽 然 可 能 不 是 最 新 的 。 要 得 到 最 新 的 数据 ， 只 有 采用 完全 的 同 
步 。 


最 后 ， 如 果 找 到 了 所 求 的 结 点 ， 判 断 它 的 值 如 果 非 空 就 直接 返 
回 ， 否 则 在 有 锁 的 状态 下 再 读 一 次 。 理 论 上 结 点 的 值 不 可 能 为 空 ， 


为 put 的 时 候 就 进行 了 判断 ， 如 果 为 空 就 要 抛 NullPointerException。 空 
值 的 唯一 源头 就 是 HashEntry 中 的 默认 值 ， 因 为 HashEntry 中 的 value 不 是 
final 的 ， 非 同步 读 取 有 可 能 读 取 到 空 值 。 仔 细 看 下 put 操作 的 语句 : 
tab[index]=new HashEntry < K, V» (key, hash, first, value) ， 在 这 
iB DH, HashEntryTJ ié RAH x] value B M(B LA Rw tab[index ] BR (E 
可 能 被 重新 排序 ， 这 就 可 能 导致 结 点 的 值 为 空 。 这 种 情况 应 当 很 罕 
见 ， 一旦 发 生 这 种 情况 ，ConcurrentHashMap 采 取 的 方式 是 在 持 有 锁 的 
情况 下 再 读 一 遍 ， 这 能 够 保证 读 到 最 新 的 值 ， 并 且 一 定 不 会 为 空 值 。 

我 们 分 别 使 用 ConcurrentHashMap 和 同步 HashMap 进 行 测 试 ， 就 
Map 的 高 并 发 读 写 而 言 ConcurentHashMap 比 HashMap 快 1 倍 。 
ConcurrentHashMap 之 所 以 有 如 此 高 的 吞吐 量 ， 得 益 于 其 内 部 实现 进行 
了 锁 分 离 ， 同 时 ，CocurrentHashMap 的 get () 操作 也 是 无 锁 的 ， 它 的 


put () 操作 的 锁 粒 度 又 小 于 同步 的 HashMap ， 这 些 都 为 
ConcurrentHashMap 在 多 线程 并 发 下 的 高 性 能 提供 了 保证 。 

总 的 来 说 ，ConcurrentHashMap 是 一 个 支持 高 并 发 的 高 性 能 的 
HashMap 实 现 ， 它 支持 完全 并 发 的 读 以 及 一 定 程 度 并 发 的 写 。 

5.4.2.2 CopyOnWriteArrayList 

第 3 章 我 们 重点 介绍 了 ArrayList， 大 家 知道 ，ArrayList 不 是 线程 安 
全 的 ， 在 多 线程 环境 下 ，Vector 或 者 CopyOnWriteArrayList 是 两 个 线程 
安全 的 List 实 现 。 因 此 ， 应 该 尽量 避免 在 多 线程 环境 下 使 用 ArrayList。 
如 果 因 为 某 些 原因 必须 使 用 的 ， 则 需要 使 用 Collections.synchronizedList 

(Listlist) 进行 包装 。 

在 了 解 CopyOnWriteArrayList 之 前 ， 我 们 先 来 了 解 一 下 Copy-On- 
Write 容器 。Copy-On-Write 简 称 COW， 是 一 种 用 于 程序 设计 中 的 优化 策 
略 。 其 基本 思路 是 ， 从 一 开始 大 家 都 在 共享 同一 个 内 容 ， 当 某 个 人 想 
要 修改 这 个 内 容 的 时 候 ， 才 会 真正 把 内 容 Copy 出 去 形成 一 个 新 的 内 容 
然后 再 改 ， 这 是 一 种 延 时 懒惰 策略 。 从 JDK1.5 开 始 Java 并 发 包 里 提供 了 
两 个 使 用 CopyOnwrite di tl Sc M Bg HRR, ENE 
CopyOnWriteArrayList#] CopyOnWriteArraySeto 

CopyOnWrite 容 器 非常 有 用 ， 可 以 在 非常 多 的 并 发 场景 中 使 用 到 。 
该 容器 是 一 种 写 时 复制 的 容器 ， 通 俗 的 理解 是 当 我 们 往 一 个 容器 添加 
元 素 的 时 候 ， 不 直接 往 当 前 容器 添加 ， 而 是 先 将 当前 容器 进行 Copy， 
复制 出 一 个 新 的 容器 ， 然 后 新 的 容器 里 添加 元 素 ， 添 加 完 元 素 之 后 ， 
再 将 原 容 器 的 引用 指向 新 的 容器 。 这 样 做 的 好 处 是 我 们 可 以 对 
CopyOnWrite 容 器 进行 并 发 的 读 ， 而 不 需要 加 锁 ， 因 为 当前 容器 不 会 添 
加 任何 元 素 。 所 以 CopyOnWrite 容 器 也 是 一 种 读 写 分 离 的 思想 ， 读 和 写 
不 同 的 容器 。 

总 的 来 说 ，CopyOnWrite 容 器 有 很 多 优点 ， 但 是 同时 也 存在 两 个 问 
题 ， 即 内 存 占用 问题 和 数据 一 致 性 问题 。 所 以 在 开发 的 需要 注意 一 
下 。 

(1) 内存 占 用 问题 。 因 为 CopyOnWrite 的 写 时 复制 机 制 ， 所 以 在 
进行 写 操作 的 时 候 ， 内 存 里 会 同时 驻扎 两 个 对 象 的 内 存 ， 旧 的 对 象 和 
新 写 入 的 对 象 (注意 : 在 复制 的 时 候 只 是 复制 容器 里 的 引用 ， 只 是 在 
写 的 时 候 会 创建 新 对 象 添加 到 新 容器 里 ， 而 旧 容 器 的 对 象 还 在 使 用 ， 


所 以 有 两 份 对 象 内 存 ) 。 如 果 这 些 对 象 占 用 的 内 存 比 较 大 ， 比 如 说 
200M 左 右 ， 那 么 再 写 入 100M 数 据 进去 ， 内 存 就 会 占用 300M， 那 么 这 
个 时 候 很 有 可 能 造成 频繁 的 Yong GC 和 Full GC。 之 前 我 们 系统 中 使 用 
了 一 个 服务 由 于 每 晚 使 用 CopyOnWrite 机 制 更 新 大 对 象 ， 造 成 了 每 晚 15 
秒 的 Full GC， 应 用 响应 时 间 也 随 之 变 长 。 

针对 内 存 占用 问题 ， 可 以 通过 压缩 容器 中 的 元 素 的 方法 来 减少 大 
对 象 的 内 存 消耗 ， 比 如 ， 如 果 元 素 全 是 10 进 制 的 数字 ， 可 以 考虑 把 它 
压缩 成 36 进 制 或 64 进 制 。 或 者 不 使 用 CopyOnWrite 容 器 ， 而 使 用 其 他 的 
并 发 容器 ， 如 ConcurrentHashMap。 

(2) 数据 一 致 性 问题 。CopyOnWrite 容 器 只 能 保证 数据 的 最 终 一 
致 性 ， 不 能 保证 数据 的 实时 一 致 性 。 所 以 如 果 你 希望 写 入 的 数据 ， 马 
上 能 读 到 ， 请 不 要 使 用 CopyOnWrite 容 器 。CopOnWriteArrayList 的 内 部 
实现 与 Vector 不 同 。CopOnWriteArrayList 实 现 了 当 对 象 进行 写 操 作 的 时 
候 复 制 该 对 象 的 功能 。 如 果 进 行 的 是 读 操作 ， 则 直接 返回 结果 ， 注 意 
整个 操作 过 程 中 不 进行 同步 操作 。CopyOnWriteArrayList 很 好 地 利用 了 
对 象 的 不 变性 ， 在 没有 对 对 象 进行 写 操作 前 ， 由 于 对 象 未 发 生 改 变 ， 
因此 不 需要 加 锁 。 而 在 试图 改变 对 象 时 ， 就 像 前 面 说 的 COW 容 器 一 
样 ， 总 是 先 获 取 对 象 的 一 个 副本 ， 然 后 对 副本 进行 修改 ， 最 后 将 副本 
与 回 ， 这 个 方式 和 JVM 的 标记 复制 算法 如 出 一 输 。 

这 种 实现 方式 的 核心 思想 是 减少 锁 竞 争 ， 从 而 提高 在 高 并 发 时 的 
读 取 性 能 ， 但 是 这 种 做 法 却 在 一 定 程度 上 牺牲 了 写 的 性 能 。 

CopyOnWriteArrayList 中 add 方 法 的 实现 (向 CopyOnWriteArrayList 
里 添加 元 素 ) 如 下 所 示 ， 可 以 发 现在 添加 的 时 候 是 需要 加 锁 的 ， 否 则 
多 线程 写 的 时 候 会 Copy 出 N 个 副本 出 来 。 


代码 清单 5-49 add 方法 源 代码 
/ 
* Appends the specified element to the end of this list. 


* (param e element to be appended to this list 
* (return <tt>true</tt> (as specified by {@link Collection#add}) 
*/ 
public boolean add(E e) { 
final ReentrantLock lock » this.lock; 
lock.lock(); 
try ( 
Object[] elements = getArray(); 
int len = elements.length; 
Object[] newElements = Arrays.copyOf(elements, len + 1); 


newElements[len] = e; 


setArray (newElements) ; 
return true; 

} finally { 
lock.unlock(); 


| 


在 每 一 次 的 add () 方法 中 ，CopyOnWriteArrayList 都 是 进行 一 次 
自我 复制 ， 同 时 ，add O 操作 也 申请 了 锁 ， 并 不 像 get () 方法 那样 。 
相对 地 ，Vector 的 add () 方法 则 要 快捷 一 些 。 因 此 ， 在 高 并 发 且 以 读 
为 主 的 应 用 场景 中 ，CopyOnWriteArrayList 要 优 于 Vector。 但 是 ， 当 写 
操作 也 很 频繁 时 ，CopyOnWriteArrayList 效 率 并 不 高 ， 所 以 应 该 优先 使 
用 Vectoro 

再 来 看 一 下 读 的 操作 (get 方 法 ) 。 读 的 时 候 不 需要 加 锁 ， 如 果 读 
的 时 候 有 多 个 线程 正在 向 CopyOnWriteArrayList 添 加 数据 ， 读 还 是 会 读 
到 旧 的 数据 ， 因 为 写 的 时 候 不 会 锁 住 上 日 的 CopyOnWriteArrayList。 


代码 清单 5-50 get 方法 源 代码 


public E get(int index) { 


return get(getArray(), index); 


| 


可 以 看 到 ， 作 为 一 个 线程 安全 的 实现 ，CopOnWriteArrayList 的 get 

0 方法 并 没有 任何 锁 操 作 。 而 对 比 Vector 的 get () 实现 ，Vector 使 用 

了 同步 关键 字 ， 所 有 的 get () 操作 都 必须 先 取 得 对 象 锁 才 能 进行 。 在 
高 并 发 的 情况 下 ， 大 量 的 锁 竞 争 会 拖累 系统 性 能 。 

只 要 了 解 了 CopyOnWrite 机 制 ， 我 们 就 可 以 模仿 着 实现 各 种 
CopyOnWrite 容 器 ， 并 且 在 不 同 的 应 用 场景 中 使 用 。JDK 中 并 没有 提供 
CopyOnWriteMap ， 我 们 可 以 参考 CopyOnWriteArrayList 来 实现 一 个 ， 
基本 代码 如 下 所 示 。 


代码 清单 5-51 CopyOnWriteMap 实现 
import java.util.Collection; 
import java.util.Map; 


import java.util.Set; 


public class CopyOnWriteMap«K, V» implements Map«K, V», Cloneable { 


private volatile Map«K, V> internalMap; 


public CopyOnWriteMap() | 
internalMap = new HashMap«K, V>(); 


public V put(K key, V value) { 


synchronized (this) ( 
Map«K, V» newMap = new HashMap«K, V>(internalMap) ; 
V val = newMap.put(key, value); 
internalMap = newMap; 


return val; 


public V get(Object key) { 
return internalMap.get (key) ; 


public void putAll (Map<? extends K, ? extends V» newData) { 
synchronized (this) { 
Map«K, V» newMap = new HashMap«K, V» (internalMap); 
newMap.putAll (newData) ; 


internalMap = newMap; 


从 前 面 的 描述 可 以 知道 ，CopyOnWrite 并 发 容器 用 于 读 多 写 少 的 并 
发 场景 ， 比 如 白 名 单 ， 黑 名 单 ， 商 品类 目的 访问 和 更 新 场景 。 假 设 我 
们 有 一 个 搜索 网 站 ， 用 户 在 这 个 网 站 的 搜索 框 中 输入 关键 字 搜 索 内 
容 ， 但 是 我 们 需要 能 够 屏 珊 某 些 关键 字 。 这 些 不 能 被 搜索 的 关键 字 会 
被 放 在 一 个 黑 名 单 当 中 ， 黑 名 单 每 天 晚上 更 新 一 次 。 当 用 户 搜索 时 ， 
会 检查 当前 关键 字 在 不 在 黑 名 单 当 中 ， 如 果 在 ， 则 提示 不 能 搜索 。 实 
现代 码 如 下 所 示 ， 我 们 使 用 了 前 面 定 义 的 CopyOnWriteMap 容 器 。 


代码 清单 5-52 黑 名 单 服务 实现 
import java.util.Map; 
import com.ifeve.book. forkjoin.CopyOnWriteMap; 
/** 
* 黑 名 单 服务 


* 


* @author fangtengfei 


* 
"i 
public class BlackListServiceImpl { 


private static  CopyOnWriteMap<String, Boolean?  blackListMap = new 
CopyOnWriteMap<String, Boolean> ( 
1000); 


public static boolean isBlackList (String id) { 
return blackListMap.get (id) == null ? false : true; 


public static void addBlackList (String id) { 
blackListMap.put (id, Boolean. TRUE) ; 


/** 

* 批量 添加 黑 名 单 

x 

* (param ids 

ay 

public static void addBlackList (Map<String,Boolean> ids) { 
blackListMap.putAll (ids); 


代码 很 简单 ， 但 是 使 用 CopyOnWriteMap 需 要 注意 两 件 事情 : 

(1) 减少 扩容 开销 。 根 据 实际 需要 ， 初 始 化 CopyOnWriteMap 的 
大 小 ， 避 免 写 时 CopyOnWriteMap 扩 容 的 开销 。 

(2) 使 用 批量 添加 。 因 为 每 次 添加 ， 容 器 每 次 都 会 进行 复制 ， 所 
以 减少 添加 次 数 ， 可 以 减少 容器 的 复制 次 数 。 如 使 用 上 面 代码 里 的 
addBlackList 方 法 。 

和 List 相 似 ， 并 发 Set 组 件 也 有 一 个 CopOnWriteArrayList， 它 实现 了 
Set 接 口 ， 并 且 是 线程 安全 的 。 它 的 内 部 实现 完全 依赖 于 
CopOnWriteArrayList， 因 此 ， 它 的 特性 和 CopOnWriteArrayList 完 全 一 
致 ， 适 用 于 读 写 多 少 的 高 并 发 场合 。 在 需要 并 发 写 的 场合 ， 则 可 以 使 
用 Collections 的 方法 public static < T > Set < T > synchronizedSet (Set < T 
> S) 得 到 一 个 线程 安全 的 Set。 


5.4.3 非 阻塞 队列 


5.4.3.1 非 阻 塞 算法 

基于 锁 的 算法 会 带 来 一 些 活 跃 度 失 败 的 风险 。 如 果 线 程 在 持 有 锁 
的 时 候 因为 阻塞 WHO， 页 面 错误 ， 或 其 他 原因 发 生 延 迟 ， 很 可 能 所 有 的 
线程 都 不 能 前 进 了 。 一 个 线程 的 失败 或 挂 起 不 应 该 影响 其 他 线程 的 失 
败 或 挂 起 ， 这 样 的 算法 成 为 非 阻塞 (nonblocking) 算法 ; 如 果 算 法 的 
每 一 个 步骤 中 都 有 一 些 线程 能 够 继续 执行 ， 那 么 这 样 的 算法 称 为 锁 自 
FA (lock-free) 算法 。 在 线程 间 使 用 CAS 进 行 协调 ， 这 样 的 算法 如 果 能 
构建 正确 的 话 ， 它 既是 非 阻 塞 的 ， 又 是 锁 自 由 的 。 非 竞争 的 CAS 总 是 
能 够 成 功 ， 如 果 多 个 线程 以 一 个 CAS 竞 争 ， 总 会 有 一 个 胜出 并 前 进 。 
非 阻 塞 算法 堆 死 锁 和 优先 级 倒置 有 “免疫 性 ”( 它 们 可 能 会 出 现 饥饿 和 
活 锁 ， 因 为 它们 允许 重 进入 ) o 

非 阻塞 算法 属于 并 发 算法 ， 它 们 可 以 安全 地 派生 它们 的 线程 ， 不 
通过 锁定 派生 ， 而 是 通过 低级 的 原子 性 的 硬件 原生 形式 ， 例 如 比较 和 
交换 。 非 阻塞 算法 的 设计 与 实现 极为 困难 ， 但 是 它们 能 够 提供 更 好 的 
吞吐 率 ， 对 生存 问题 (例如 死 锁 和 优先 级 反 转 ) 也 能 提供 更 好 的 防 
御 。 原 子 变量 类 向 用 户 提 供 了 这 些 底层 级 原 语 ， 也 能 够 当做 “更 佳 的 
volatile 变 量 ” 使 用 ， 同 时 提供 了 整数 类 和 对 象 引 用 的 原子 化 更 新 操作 。 


下 面 的 示例 代码 实现 了 非 阻 塞 堆栈 ， 其 中 的 push O 和 pop O 操 
作 在 结构 上 和 希望 在 提交 工作 的 时 候 ， 底 层 假 设 没 有 失效 。push 0 A 
法 观察 当前 最 顶 的 节点 ， 构 建 一 个 新 节点 放 在 堆栈 上 ， 然 后 ， 如 果 最 
顶端 的 节点 在 初始 观察 之 后 没有 变化 ， 那 么 就 安装 新 节点 。 如 果 CAS 
失败 ， 意 味 着 另 一 个 线程 已 经 修改 了 堆栈 ， 那 么 过 程 就 会 重新 开始 。 


代码 清单 5-53 ”使 用 Treiber 算法 的 非 阻塞 堆栈 


AtomicReference<Node<E>> head = new AtomicReference«Node«E»»(); 


public void push(E item) ( 
Node<E> newHead = new Node«E» (item); 
Node«E» oldHead; 
do ( 
oldHead = head.get(); 
newHead.next - oldHead; 


) while (!head.compareAndSet (oldHead, newHead)); 


public E pop() { 

Node<E> oldHead; 

Node<E> newHead; 

do { 
oldHead = head.get(); 
if (oldHead == null) 

return null; 

newHead = oldHead.next; 


} while (!head.compareAndSet (oldHead, newHead) ) ; 


return oldHead.item; 


} 


static class Node«E» { 
final E item; 


Node<E> next; 


public Node(E item) { this.item = item; } 
} 
} 


在 轻 度 到 中 度 的 争 用 情况 下 ， 非 阻塞 算法 的 性 能 会 超越 阻塞 算 
法 ， 因 为 CAS 的 多 数 时 间 都 在 第 一 次 党 试 时 就 成 功 ， 而 发 生 争 用 时 的 
开销 也 不 涉及 线程 挂 起 和 上 下 文 切换 ， 只 多 了 几 个 循环 达 代 。 没 有 争 
用 的 CAS 要 比 没有 争 用 的 锁 便宜 得 多 (这 人 句 话 肯定 是 真 的 ， 因 为 没有 
争 用 的 锁 涉 及 CAS 加 上 额外 的 处 理 ) ， 而 争 用 的 CAS 比 争 用 的 锁 获 
取 涉 及 更 短 的 延迟 。 

在 高 度 争 用 的 情况 下 ( 即 有 多 个 线程 不 断 争 用 一 个 内 存 位 置 的 时 
候 ) ， 基 于 锁 的 算法 开始 提供 比 非 阻塞 算法 更 好 的 吞吐 率 ， 因 为 当 线 
程 阻塞 时 ， 它 就 会 停止 争 用 ， 耐 心地 等 候 轮 到 上 自己， 从 而 避免 了 进 一 
步 争 用 。 但 是 ， 这 么 高 的 争 用 程度 并 不 常见 ， 因 为 多 数 时 候 ， 线 程 会 
把 线程 本 地 的 计算 与 争 用 共享 数据 的 操作 分 开 ， 从 而 给 其 他 线程 使 用 
共享 数据 的 机 会 。 (这 么 高 的 争 用 程度 也 表明 需要 重新 检查 算法 ， 朝 
着 更 少 共享 数据 的 方向 努力 。) 

目前 为 止 的 示例 (计数 器 和 堆栈 ) 都 是 非常 简单 的 非 阻 塞 算法 ， 
一 旦 掌握 了 在 循环 中 使 用 CAS， 就 可 以 容易 地 模仿 它们 。 对 于 更 复杂 
的 数据 结构 ， 非 阻塞 算法 要 比 这 些 简单 示例 复杂 得 多 ， 因 为 修改 链 
表 、 树 或 哈 希 表 可 能 涉及 对 多 个 指针 的 更 新 。CAS 支持 对 单一 指针 的 
原子 性 条 件 更 新 ， 但 是 不 支持 两 个 以 上 的 指针 。 所 以 ， 要 构建 一 个 非 
阻塞 的 链表 、 树 或 哈 希 表 ， 需 要 找到 一 种 方式 ， 可 以 用 CAS 更 新 多 个 
指针 ， 同 时 不 会 让 数据 结构 处 于 不 一 致 的 状态 。 


在 链表 的 尾部 插入 元 素 ， 通 单 涉及 对 两 个 指针 的 更 新 :“ 尾 ”指针 
总 是 指向 列表 中 的 最 后 一 个 元 素 , “下 一 个 ”指针 从 过 去 的 最 后 一 个 元 
素 指 向 新 插入 的 元 素 。 因 为 需要 更 新 两 个 指针 ， 所 以 需要 两 个 CAS。 
在 独立 的 CAS 中 更 新 两 个 指针 带 来 了 两 个 需要 考虑 的 潜在 问题 : 如 果 
第 一 个 CAS 成 功 ， 而 第 二 个 CAS 失败 ， 会 发 生 什么 ?” 如 果 其 他 线程 
在 第 一 个 和 第 二 个 CAS 之 间 企 图 访问 链表 ， 会 发 生 什么 ? 

对 于 非 复 杂 数 据 结 构 ， 构 建 非 阻 塞 算法 的 “技巧 * 是 确保 数据 结构 
总 处 于 一 致 的 状态 (甚至 包括 在 线程 开始 修改 数据 结构 和 它 完成 修改 
之 间 ) ， 还 要 确保 其 他 线程 不 仅 能 够 判断 出 第 一 个 线程 已 经 完成 了 更 
新 还 是 处 在 更 新 的 中 途 ， 还 能 够 判断 出 如 果 第 一 个 线程 走向 AWOL, 
完成 更 新 还 需要 什么 操作 。 如 果 线 程 发 现 了 处 在 更 新 中 途 的 数据 结 
构 ， 它 就 可 以 “帮助 * 正 在 执行 更 新 的 线程 完成 更 新 ， 然 后 再 进行 自己 
的 操作 。 当 第 一 个 线程 回来 试图 完成 自己 的 更 新 时 ， 会 发 现 不 再 需要 
了 ， 返 回 即 可 ， 因 为 CAS 会 检测 到 帮助 线程 的 干预 〈 在 这 种 情况 下 ， 
是 建设 性 的 干预 ) 。 

这 种 “帮助 邻居 ”的 要 求 ， 对 于 让 数据 结构 免 受 单个 线程 失败 的 影 
响 ， 是 必需 的 。 如 果 线 程 发 现 数据 结构 正 处 在 被 其 他 线程 更 新 的 中 
途 ， 就 会 等 候 其 他 线程 完成 更 新 ， 那 么 如 果 其 他 线程 在 操作 中 途 失 
败 ， 这 个 线程 就 可 能 永远 等 候 下 去 。 即 使 不 出 现 故 障 ， 这 种 方式 也 会 
提供 糟糕 的 性 能 ， 因 为 新 到 达 的 线程 必须 放弃 处 理 器 ， 导 致 上 下 文 切 
换 ， 或 者 等 到 自己 的 时 间 片 过 期 。 

非 阻塞 算法 要 比 基 于 锁 的 算法 复杂 得 多 。 开 发 非 阻塞 算法 是 相当 
专业 的 训练 ， 而 且 要 证 明 算 法 的 正确 也 极为 困难 。 但 是 在 Java 版 本 之 
间 并 发 性 能 上 的 众多 改进 来 自 对 非 阻 塞 算法 的 采用 ， 而 且 随 着 并 发 性 
能 变 得 越 来 越 重 要 ， 可 以 预见 在 Java 平台 的 未 来 发 行 版 中 ， 会 使 用 更 
多 的 非 阻 塞 算法 。 

5.4.3.2 ConcurrentLinkedQueue 

在 Java 多 线程 应 用 中 ， 队 列 的 使 用 率 很 高 ， 多 数 生产 消费 模型 的 首 
选 数据 结构 就 是 队列 (先进 先 出 ) 。Java 提 供 的 线程 安全 的 队列 方式 可 
以 分 为 阻塞 队列 和 非 阻塞 队列 ， 其 中 阻塞 队列 的 典型 例子 是 
BlockingQueue， 非 阻塞 队列 的 典型 例子 是 ConcurrentLinkedQueue ， 在 


实际 应 用 中 要 根据 实际 需要 选用 阻塞 队列 或 者 非 阻塞 队列 。 不 论 哪 种 
实现 ， 都 继承 自 Queue 接 口 。 

ConcurrentLinkedQueue 是 Queue 的 一 个 安全 实现 。Queue 中 元 素 按 
FIFO 原 则 进行 排序 ， 采 用 CAS 操 作 来 保证 元 素 的 一 致 性 ， 当 我 们 添加 
一 个 元 素 的 时 候 ， 它 会 添加 到 队列 的 尾部 ， 当 我 们 获取 一 个 元 素 时 ， 
它 会 返回 队列 头 部 的 元 素 。 它 采用 了 “wait-free[5]” 算 法 来 实现 。 由 于 
LinkedBlockingQueue 实现 是 线程 安全 的 ， 实 现 了 先进 先 出 等 特性 ， 是 
作为 生产 者 消费 者 的 首选 ，LinkedBlockingQueue 可 以 指定 容量 ， 也 可 
以 不 指定 ， 不 指定 的 话 ， 默 认 最 大 是 Integer.MAX_VALUE， 其 中 主要 
用 到 put 和 take 方 法 ，pnut 方 法 在 队列 满 的 时 候 会 阻塞 直到 有 队列 成 员 被 
消费 ，take 方 法 在 队列 空 的 时 候 会 阻塞 ， 直 到 有 队列 成 员 被 放 进 来 。 

ConcurrentLinkedQueue 由 head 节 点 和 tair 节 点 组 成 ， 每 个 节点 

(Node) 由 节点 元 素 (item) 和 指向 下 一 个 节点 的 引用 (next) 组 成 ， 
节点 与 节点 之 间 就 是 通过 这 个 next 关 联 起 来 ， 从 而 组 成 一 张 链表 结构 的 
队列 。 默 认 情 况 下 head 节 点 存储 的 元 素 为 宝 ，tair 节 点 等 于 head 节 点 ， 
如 代码 private transient volatile Node < e > tail=head; o 

入 队列 就 是 将 入 队 节 点 添加 到 队列 的 尾部 。 为 了 方便 理解 入 队 时 
队列 的 变化 ， 以 及 head 节 点 和 tair 节 点 的 变化 ， 每 添加 一 个 节点 我 就 做 
了 一 个 队列 的 快照 图 ， 如 图 5-8 所 示 。 
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图 5-8 出 入 队列 流程 图 

(1) 添加 元 素 1。 队 列 更 新 head 节 点 的 next 节 点 为 元 素 1 节 点 。 又 
因为 tail 节 点 默认 情况 下 等 于 head 节 点 ， 所 以 它们 的 next 节 点 都 指向 元 
素 1 节 点 ; 

(2) 添加 元 素 2。 队 列 首先 设置 元 素 1 节 点 的 next 节 点 为 元 素 2 节 
点 ， 然 后 更 新 tail 节 点 指向 元 素 2 节 点 ; 

(3) 添加 元 素 3， 设 置 tail 节 点 的 next 节 点 为 元 素 3 节 ; 

(4) 添加 元 素 4， 设 置 元 素 3 的 next 节 点 为 元 素 4 节 点 ， 然 后 将 tail 
节点 指向 元 素 4 节 点 。 

入 队 主 要 做 两 件 事情 ， 第 一 是 将 入 队 节点 设置 成 当前 队列 尾 节点 
的 下 一 个 节点 。 第 二 是 更 新 tail 节 点 ， 如 果 tail 节 点 的 next 节 点 不 为 空 ， 
则 将 入 队 节 点 设置 成 tail 节 点 ， 如 果 tail 节 点 的 next 节 点 为 空 ， 则 将 入 队 
节点 设置 成 tail 的 next 节 点 ? 所 以 tail 节 点 不 总 是 尾 节 点 。 

上 面 的 分 析 让 我 们 从 单线 程 入 队 的 角度 来 理解 入 队 过 程 ， 但 是 多 
个 线程 同时 进行 入 队 情况 就 变 得 更 加 复杂 ， 因 为 可 能 会 出 现 其 他 线程 
插队 的 情况 。 如 果 有 一 个 线程 正在 入 队 ， 那 么 它 必 须 先 获取 尾 节 点 ， 
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然后 设置 尾 节点 的 下 一 个 节点 为 入 队 节点 ， 但 这 时 可 能 有 另外 一 个 线 
程 插队 了 ， 那 么 队列 的 尾 节 点 就 会 发 生变 化 ， 这 时 当前 线程 要 暂停 入 
队 操 作 ， 然 后 重新 获取 尾 节 点 。 让 我 们 再 通过 源码 来 详细 分 析 下 它 是 
如 何 使 用 CAS 算 法 来 入 队 的 。 


代码 清单 5-54 ConcurrentLinkedQueue 源 代码 

public boolean offer(E e) { 

if (e == null) throw new NullPointerException(); 

// 入 队 前 ， 创 建 一 个 入 队 节点 

Node</e><e> n = new Node</e><e>(e) ; 

retry: 

// 死 循环 ， 入 队 不 成 功 反复 入 队 。 

for (ii) { 

// 创 建 一 个 指向 tail 节点 的 引用 

Node</e><e> t = tail; 

| [p 用 来 表示 队列 的 尾 节 点 ， 默 认 情 况 下 等 于 tail 节点 。 

Node</e><e> p = t; 

for (int hops = 0; ; hops++) { 

LIRA p 节点 的 下 一 个 节点 。 

Node</e><e> next = succ(p); 

| [next 节点 不 为 室 ， 说 明 p 不 是 尾 节 点 ， 需 要 更 新 p SERCH next 节点 

if (next != null) { 

// 箱 环 了 两 次 及 其 以 上 ， 并 且 当 前 节点 还 是 不 等 于 尾 节点 

if (hops > HOPS && t != tail) 

continue retry; 

p = next; 

} 

/1 如 果 p 是 尾 节点 ， 则 设置 p 节点 的 next 节点 为 入 队 节点 。 

else if (p.casNext(null, n)) { 

//wR tail 节点 有 大 于 等 于 1 个 next 节点 ， 则 将 入 队 节 点 设置 成 tair 节点 ， 更 新 失败 了 也 没关系 ， 因 
为 失败 了 表示 有 其 他 线程 成 功 更 新 了 tair PA, 

if (hops >= HOPS) 

casTail(t, n); // 更 新 tail 节点 ， 允 许 失败 


return true; 
} 
// pA next 节点 ,表示 p next 节点 是 尾 节 点 ， 则 重新 设置 p 节点 


else { 


从 源 代 码 角 度 来 看 整个 入 队 过 程 主 要 做 两 件 事情 。 第 一 是 定位 出 
尾 节点 ， 第 二 是 使 用 CAS 算 法 能 将 入 队 节 点 设置 成 尾 节 点 的 next 节 点 ， 
如 不 成 功 则 重 试 。 

第 一 步 定 位 尾 节 点 。tail 节 点 并 不 总 是 尾 节点 ， 所 以 每 次 入 队 都 必 
须 先 通过 tail 节 点 来 找到 尾 节点 ， 尾 节点 可 能 就 是 tail 节 点 ， 也 可 能 是 tail 
节点 的 next 节 点 。 代 码 中 循环 体 中 的 第 一 个 if 就 是 判断 tail 是 否 有 next 节 
点 ， 有 则 表示 next 节 点 可 能 是 尾 节点 。 获 取 tail 节 点 的 next 节 点 需要 注意 
的 是 p 节 点 等 于 p 的 next 节 点 的 情况 ， 只 有 一 种 可 能 就 是 p 节 点 和 p 的 next 
节点 都 等 于 空 ， 表 示 这 个 队列 刚 初 始 化 ， 正 准备 添加 第 一 次 节点 ， 所 
以 需要 返回 head 节 点 。 

第 二 步 设置 入 队 节 点 为 尾 节 点 。p.casNext (nul, n) 方法 用 于 将 
入 队 节 点 设置 为 当前 队列 尾 节点 的 next 节 点 ，p 如 果 是 null 表 示 p 是 当前 
队列 的 尾 节点 ， 如 果 不 为 null 表 示 有 其 他 线程 更 新 了 尾 节点 ， 则 需要 重 
新 获取 当前 队列 的 尾 节点 。 

出 队列 的 就 是 从 队列 里 返回 一 个 节点 元 素 ， 并 清空 该 节点 对 元 素 
的 引用 。 让 我 们 通过 每 个 节点 出 队 的 快照 来 观察 下 head 节 点 的 变化 ， 
如 图 5-9 所 示 。 
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图 5-9 队列 变化 图 

从 上 图 可 知 ， 并 不 是 每 次 出 队 时 都 更 新 head 节 点 ， a 
元 素 时 ， 直 接 弹出 head 节 点 里 的 元 素 ， 而 不 会 更 新 head 节 mo RAS 
head 节 点 里 没有 元 素 时 ， 出 队 操 作 才 会 更 新 head 节 点 。 这 种 做 法 也 是 通 
过 hops 变 量 来 减少 使 用 CAS 更 新 head 节 点 的 消耗 ， 从 而 提高 出 队 效 率 。 

从 上 面 的 介绍 我 们 知道 ，ConcurrentLinkedQueue 是 一 个 适用 于 高 
并 发 场景 下 的 队列 。 它 通 过 无 锁 的 方式 ， 实 现 了 高 并 发 状态 下 的 高 ' 
能 ， 通 常 ，ConcurrentLinkedQueue 的 性 能 要 好 于 BlockingQueue。 使 用 
以 下 代码 测试 ConcurrentLinkedQueue 以 及 LinkedBlockingQueue 的 性 
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代码 清单 5-55 ConcurrentLinkedQueue 测试 
import java.util.concurrent.ConcurrentLinkedQueue; 
import java.util.concurrent.CountDownLatch; 
import java.util.concurrent.ExecutorService; 


import java.util.concurrent.Executors; 


public class ConcurrentLinkedQueueTest { 


private static ConcurrentLinkedQueue<Integer> queue new 
ConcurrentLinkedQueue<Integer> () ; 

private static int count = 2; // 线程 个 数 

//CountDownLatch， 一 个 同步 辅助 类 ， 在 完成 一 组 正在 其 他 线程 中 执行 的 操作 之 前 ， 它 允许 一 个 或 多 
个 线程 一 直 等 待 。 


private static CountDownLatch latch = new CountDownLatch (count); 


public static void main(String[] args) throws InterruptedException { 
long timeStart = System.currentTimeMillis(); 
ExecutorService es = Executors.newFixedThreadPool (4); 
ConcurrentLinkedQueueTest.offer(); 
for (int i = 0; i < count; itt) { 
es.submit (new Poll()); 
} 
latch.await(); // 使 得 主线 程 (main) 阻塞 直到 latch.countDown() 47 MAT 
System.out.println("cost time " + (System.currentTimeMillis() - timeStart) 
+ "msi" iz 


es.shutdown(); 


* 生产 
y 
public static void offer() { 
for (int i = 0; i < 100000; i++) { 


queue.offer (i); 


* Qauthor 林 计 钦 

* (version 1.0 2013-7-25 F# 05:32:56 

*/ 

static class Poll implements Runnable { 
public void run() { 
// while (queue.size()>0) { 
while (!queue.isEmpty()) { 
System.out.println(queue.poll()); 

} 


latch. countDown () ; 


} 


ConcurrentLinkedQueue 和 其 他 并 发 集合 一 样 ， 它 把 一 个 元 素 放 入 
到 队列 的 线程 的 优先 级 高 于 对 元 素 的 访问 和 移 除 的 线程 。 

总 的 来 说 ， 使 用 非 阻 塞 队 列 的 好 处 是 允许 多 线程 操作 共同 的 队列 
时 不 需要 额外 的 同步 消耗 ， 另 外 就 是 队列 会 自动 平衡 负载 ， 即 那 边 
(生产 与 消费 两 边 ) 处 理 快 了 就 会 被 阻塞 掉 ， 从 而 减少 两 边 的 处 理 速 
度 差 距 。 


5.4.4 阻塞 队列 


与 ConcurrentLinkedQueue 的 使 用 场景 不 同 的 是 ， 在 Java 的 
Concurrent 包 中 ， 添 加 了 阻塞 队列 BlockingQueue。 BlockingQueue 的 主 
要 功能 并 不 是 在 于 提升 高 并 发 时 的 队列 性 能 ， 而 在 于 简化 多 线程 间 的 
数据 共享 。BlockingQueue 是 一 个 队列 ， 一 个 队列 在 数据 结构 中 所 起 的 
作用 大 致 如 图 5-10 所 示 。 
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图 5-10 对 列 的 作用 

从 上 图 我 们 可 以 很 清楚 地 看 到 ， 通 过 一 个 共享 的 队列 ， 可 以 使 得 
数据 由 队列 的 一 端 输入 ， 从 另外 一 端 输出 。 

常用 的 队列 主要 有 以 下 两 种 ， 当 然 通 过 不 同 的 实现 方式 ， 还 可 以 
延伸 出 很 多 不 同类 型 的 队列 ，DelayQueue 就 是 其 中 的 一 种 。 

m 先进 先 出 (FIFO) : 先 插入 的 队列 的 元 素 也 最 先 出 队列 ， 类 似 
于 排队 的 功能 。 从 某 种 程度 上 来 说 这 种 队列 也 体现 了 一 种 公平 性 。 

m 后 进 先 出 (LIFO) : 后 插入 队列 的 元 素 最 先 出 队列 ， 这 种 队列 
优先 处 理 最 近 发 生 的 事件 。 

多 线程 环境 中 ， 通 过 队列 可 以 很 容易 实现 数据 共享 ， 比 如 经 典 的 
“生产 者 ”和 “消费 者 ”模型 中 ， 通 过 队列 可 以 很 便利 地 实现 两 者 之 间 的 数 
据 共 享 。 假 设 我 们 有 若干 生产 者 线程 ， 另 外 又 有 若干 个 消费 者 线程 。 
如 果 生 产 者 线程 需要 把 准备 好 的 数据 共享 给 消费 者 线程 ， 利 用 队列 的 
方式 来 传递 数据 ， 就 可 以 很 方便 地 解决 他 们 之 间 的 数据 共享 问题 。 但 
如 果 生 产 者 和 消费 者 在 某 个 时 间 段 内 ， 万 一 发 生 数据 处 理 速度 不 匹配 
的 情况 呢 ? 理想 情况 下 ， 如 果 生 产 者 产 出 数据 的 速度 大 于 消费 者 消费 
的 速度 ， 并 且 当 生产 出 来 的 数据 累积 到 一 定 程度 的 时 候 ， 那 么 生产 者 
必须 暂停 等 待 一 下 《阻塞 生产 者 线程 ) ， 以 便 等 待 消费 者 线程 把 累积 
的 数据 处 理 完毕 ， 反 之 亦 然 。 然 而 ， 在 concurrent 包 发 布 以 前 ， 在 多 线 


程 环境 下 ， 我 们 每 个 程序 员 都 必须 去 自己 控制 这 些 细节 ， 尤 其 还 要 兼 
顾 效 率 和 线程 安全 ， 而 这 会 给 我 们 的 程序 带 来 不 小 的 复杂 度 。 好 在 此 
时 ， 强 大 的 concurrent 包 横 空 出 世 了 ， 而 他 也 给 我 们 带 来 了 强大 的 
BlockingQueue。 《在 多 线程 领域 : 所 谓 阻塞 ， 在 某 些 情况 下 会 挂 起 线 
Tz 〈《 即 阻塞 ) ， 一 旦 条 件 满 足 ， 被 挂 起 的 线程 又 会 自动 被 唤醒 ) 

图 5-11 和 图 5-12 演 示 了 BlockingQueue 的 两 个 常见 阻塞 场景 。 


Blocking Queue 


Blockingoutput —Y 


Blocking Consumer 
图 5-11 常见 阻塞 场景 


如 上 图 所 示 : 当 队 列 中 没有 数据 的 情况 下 ， 消 费 者 端的 所 有 线程 
都 会 被 自动 阻塞 GEE) ， 直 到 有 数据 放 入 队列 。 
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Blocking Producer 


图 5-12 自动 阻塞 场景 


如 上 图 所 示 : 当 队 列 中 填 满 数据 的 情况 下 ， 生 产 者 端的 所 有 线程 
都 会 被 自动 阻塞 〈 挂 起 ) ， 直 到 队列 中 有 空 的 位 置 ， 线 程 被 自动 唤 
BE. 

这 也 是 我 们 在 多 线程 环境 下 ， 为 什么 需要 BlockingQueue 的 原因 。 
作为 BlockingQueue 的 使 用 者 ， 我 们 再 也 不 需要 关心 什么 时 候 需 要 阻塞 
线程 ， 什 么 时 候 需 要 唤醒 线程 ， 因 为 这 一 切 BlockingQueue 都 给 你 一 手 
包办 了 。 

BlockingQueue 的 典型 应 用 场景 是 在 生产 者 -消费 者 模式 中 ， 生 产 者 
总 是 将 产品 放 入 BlockingQueue 队 列 ， 而 消费 者 从 队列 中 取出 产品 消 
费 ， 从 而 实现 数据 共享 。 

BlockingQueue 提 供 一 种 读 写 阻 塞 等 待 的 机 制 ， 即 如 果 消 费 者 速度 
较 快 ， 则 了 BlockingQueue 可 能 被 清空 ， 此 时 ， 消 费 线 程 再 试图 从 
BlockingQueue 读 取 数 据 时 就 会 被 阻塞 。 反 之 ， 如 果 生 产 线程 较 快 ， 则 
BlockingQueue 可 能 会 被 装 满 ， 此 时 ， 生 产 线程 再 试图 向 BlockingQueue 
队列 中 装 入 数据 时 ， 便 会 被 阻塞 等 待 。 

BlockingQueue 类 族 最 常用 的 应 用 场景 是 多 线程 间 的 数据 共享 ， 如 
果 需 要 高 性 能 的 队列 ， 可 以 使 用 ConcurentLinkedQueue o 
BlockingQueue 不 光 实 现 了 一 个 完整 队列 所 具有 的 基本 功能 ， 同 时 在 多 
线程 环境 下 ， 他 还 自动 管理 了 多 线 间 的 自动 等 待 于 唤醒 功能 ， 从 而 使 
得 程序 员 可 以 忽略 这 些 细 节 ， 关 注 更 高 级 的 功能 。 

BlockingQueue 的 核心 方法 如 下 。 

m offer (object) : 将 object 加 到 BlockingQueue 里 ， 如 果 
BlockingQueue 有 足够 空间 ， 则 返回 true， 否 则 返回 false， 表 示 该 方法 不 
阻塞 当前 执行 方法 的 线程 。 

m offer (Eo, longtimeout, TimeUnitunit) : 可 以 设 定 等 待 的 时 
间 ， 如 果 在 指定 的 时 间 内 ， 还 不 能 往 队 列 中 加 入 BlockingQueue， 则 返 
回 失 败 。 

m put (object) : 把 object 加 到 BlockingQueue 里 ， 如 果 BlockQueue 
没有 足够 空间 ， 则 调用 此 方法 的 线程 被 阻 断 直 到 BlockingQueue 里 面 有 
空 闪 空间 再 继续 。 


m poll (time) : 取 走 BlockingQueue 里 排 在 首位 的 对 象 ， 若 不 能 立 
即 取 出 ， 则 可 以 等 tme 人 参数 规定 的 时 间 ， 取 不 到 时 返回 Null。 

m poll (long timeout, TimeUnit unit) : 从 BlockingQueue 取 出 一 个 
队 首 的 对 象 ， 如 果 在 指定 时 间 内 ， 队 列 一 旦 有 数据 可 取 ， 则 立即 返回 
队列 中 的 数据 。 超 时 后 依然 没有 取得 数据 则 返回 失败 。 

m take () : 取 走 BlockingQueue 里 排 在 首位 的 对 象 ， 若 
BlockingQueue 为 空 ， 阻 断 进 入 等 待 队列 直 到 BlockingQueue 有 新 的 数据 
被 加 入 。 

m drainTo () : 一 次 性 从 BlockingQueue 获 取 所 有 可 用 的 数据 对 象 

(还 可 以 指定 获取 数据 的 个 数 ) ， 通 过 此 方法 ， 可 以 提升 获取 数据 的 
效率 ， 不 需要 多 次 分 批 加 锁 或 释放 锁 。 

注意 : BlockingQueue 不 接受 null 元 素 。 试 图 add、put 或 offer 一 个 
null 元 素 时 ， 某 些 实现 会 抛 出 NulPointerException。 null 被 用 作 指 示 
poll 操作 失败 的 警戒 值 。 

如 果 BlockingQueue 是 空 的 ， 从 BlockingQueue 取 东西 的 操作 将 会 被 
阻 断 进 入 等 待 状态 ， 直 到 BlockingQueue 进 了 东西 才 会 被 唤醒 ， 同 样 ， 
如 果 BlockingQueue 是 满 的 ， 任 何 试图 往 里 存 东 西 的 操作 也 会 被 阻 断 进 
入 等 待 状态 ， 直 到 BlockingQueue 里 有 空间 时 才 会 被 唤醒 继续 操作 。 

BlockingQueue 接口 提供 了 五 种 主要 的 实现 包括 
ArrayBlockingQueue, LinkedBlockingQueue 、 PriorityBlockingQueue、 
DelayQueue 和 SynchronousQueue， 


5.4.5.1 ArrayBlockingQueue 


它 是 一 种 基于 数组 的 阻塞 队列 实现 ， 在 ArrayBlockingQueue 内 部 ， 
维护 了 一 个 定 长 数组 ， 用 于 缓存 队列 中 的 数据 对 象 。 上 此外， 
ArrayBlockingQueue 内 部 还 保持 着 两 个 整形 变量 ， 分 别 标识 着 队列 的 头 
部 和 尾部 在 数组 中 的 位 置 。 在 创建 ArrayBlockingQueue 时 ， 还 可 以 控制 
对 象 的 内 部 锁 是 否 采用 公平 锁 ， 默 认 采 用 非 公 平 锁 。 

ArrayBlockingQueue 是 一 种 规定 大 小 的 BlockingQueue， 其 构造 水 数 
必须 带 一 个 int 参 数 来 指明 其 大 小 。 其 所 含 的 对 象 是 以 FIFO (先入 先 
tH) 顺序 排序 的 。 基 于 数组 的 阻塞 队列 实现 ， 在 ArrayBlockingQueue 内 
部 ， 维 护 了 一 个 定 长 数组 ， 以 便 缓存 队列 中 的 数据 对 象 ， 这 是 一 个 常 


用 的 阻塞 队列 ， 除 了 一 个 定 长 数组 外 ，ArrayBlockingQueue 内 部 还 保存 
着 两 个 整形 变量 ， 分 别 标识 着 队列 的 头 部 和 尾部 在 数组 中 的 位 置 。 
ArrayBlockingQueue 在 生产 者 放 入 数据 和 消费 者 获取 数据 ， 都 是 共用 同 
一 个 锁 对 象 ， 由 此 也 意味 着 两 者 无 法 真正 并 行 运 行 ， 这 点 尤其 不 同 于 
LinkedBlockingQueue; 按照 实现 原理 来 分 析 ，ArrayBlockingQueue 完 全 
可 以 采用 分 离 锁 ， 从 而 实现 生产 者 和 消费 者 操作 的 完全 并 行 运行 。 
Doug Lea 之 所 以 没 这 样 去 做 ， 也 许 是 因为 ArrayBlockingQueue 的 数据 写 
入 和 获取 操作 已 经 足够 轻巧 ， 以 至 于 引入 独立 的 锁 机 制 ， 除 了 给 代码 
带 来 额外 的 复杂 性 外 ， 其 在 性 能 上 完全 占 不 到 任何 便宜 。 
ArrayBlockingQueue 和 LinkedBlockingQueue 间 还 有 一 个 明显 的 不 同 之 处 
在 于 ， 前 者 在 插入 或 删除 元 素 时 不 会 产生 或 销毁 任何 额外 的 对 象 实 
例 ， 而 后 者 则 会 生成 一 个 额外 的 Node 对 象 。 这 在 长 时 间 内 需要 高 效 并 
发 地 处 理 大 批量 数据 的 系统 中 ， 其 对 于 GC 的 影响 还 是 存在 一 定 的 区 
别 。 而 在 创建 ArrayBlockingQueue 时 ， 我 们 还 可 以 控制 对 象 的 内 部 锁 是 
否 采 用 公平 锁 ， 默 认 采 用 非 公平 锁 。 

ArrayBlockingQueue 是 一 个 由 数组 支持 的 有 界 阻塞 队列 。 此 队列 按 
FIFO (先进 先 出 ) 原则 对 元 素 进 行 排序 。 队 列 的 头 部 是 在 队列 中 存在 
时 间 最 长 的 元 素 ， 队 列 的 尾部 是 在 队列 中 存在 时 间 最 短 的 元 素 。 新 元 
素 插入 到 队列 的 尾部 ， 队 列 检索 操作 则 是 从 队列 头 部 开始 获得 元 素 。 

这 是 一 个 典型 的 < 有 界 缓存 区 ”， 固 定 大 小 的 数组 在 其 中 保持 生产 
者 插入 的 元 素 和 使 用 者 提取 的 元 素 。 一 旦 创建 了 这 样 的 缓存 区 ， 就 不 
能 再 增加 其 容量 。 试 图 向 已 满 队 列 中 放 入 元 素 会 导致 放 入 操作 受阻 
塞 ; 试图 从 空 队列 中 检索 元 素 将 导致 类 似 阻 塞 。 

ArrayBlockingQueue 创 建 的 时 候 需 要 指定 容量 capacity (可 以 存储 
的 最 大 的 元 素 个 数 ， 因 为 它 不 会 自动 扩容 ) 。 其 中 一 个 构造 方法 如 下 
代码 所 示 。 


代码 清单 5-56 ArrayBlockingQueue 构造 函数 
public ArrayBlockingQueue (int capacity, boolean fair) { 
if (capacity <= 0) 
throw new IllegalArgumentException(); 
this.items = (E[]) new Object [capacity]; 
lock = new ReentrantLock (fair); 
notEmpty = lock.newCondition(); 
notFull = lock.newCondition(); 
} 
ArrayBlockingQueue 类 中 定义 的 变量 有 ， 
/xx The queued items */ 


private final E[] items; 


/xx items index for next take, poll or remove */ 
private int takeIndex; 
/xx items index for next put, offer, or add. */ 
private int putIndex; 


/xx Number of items in the queue */ 


private int count; 


/* 

* Concurrency control uses the classic two-condition algorithm 
* found in any textbook. 

uU 

/xx Main lock guarding all access */ 

private final ReentrantLock lock; 

/xx Condition for waiting takes */ 

private final Condition notEmpty; 

/xx Condition for waiting puts */ 


private final Condition notFull; 


使 用 数组 items 来 存储 元 素 ， 由 于 是 循环 队列 ， 使 用 takeIndex 和 
putImndex 来 标记 put 和 take 的 位 置 。 可 以 看 到 ， 该 类 中 只 定义 了 一 个 锁 
ReentrantLock， 定 义 两 个 Condition 对 象 : notEmputy 和 notFull， 分 别 用 
来 对 take 和 和 put 操作 进 行 所 控制 。 注 : 本 文 主要 讲解 put () 和 take () 
操作 ， 其 他 方法 类 似 。 

put (Ee) 方法 的 源码 如 下 。 进 行 put 操 作 之 前 ， 必 须 获 得 锁 并 进行 
加 锁 操作 ， 以 保证 线程 安全 性 。 加 锁 后 ， 若 发 现 队 列 已 满 ， 则 调用 
notFull.await () 方法 ， 如 当前 线程 陷入 等 待 。 直 到 其 他 线程 take 走 某 
个 元 素 后 ， 会 调用 notFull.signal () 方法 来 激活 该 线程 。 激 活 之 后 ， 继 
续 下 面 的 插入 操作 。 


代码 清单 5-57 put 方法 源 代码 
/[** 
* Inserts the specified element at the tail of this queue, waiting 
* for space to become available if the queue is full. 
x 
ri 
public void put (E e) throws InterruptedException { 
// 不 能 存放 null 元 素 
if (e == null) throw new NullPointerException(); 
final E[] items = this.items; // 数 组 队列 
final ReentrantLock lock = this.lock; 
// 加 锁 
lock.lockInterruptibly(); 
try{ 
try{ 
// 当 队列 满 时 ， 调 用 notFull,await () 方 法 ， 使 该 线程 阻塞 。 
// 直 到 take 掉 某 个 元 素 后 ， 调 用 notFu11 .signal () 方 法 激活 该 线程。 


while (count == items.length) 


u— 


notFull.await(); 


Jcatch (InterruptedException ie) { 


notFull.signal(); // propagate to non-interrupted thread 
throw ie; 

} 

// 把 元 素 e HAINE 

insert (e); 

finally 

// 解 锁 


lock.unlock(); 


insert (Ee) 方法 如 下 所 示 。 


代码 清单 5-58 inset 方法 源 代码 
[+e 
* Inserts element at current put position, advances, and signals. 
* Call only when holding lock. 
*/ 
private void insert (E x) { 
items[putIndex] = x; 
// 下 标 如 1 或 者 等 于 0 
putIndex = inc(putIndex); 
++count; // 计 数 加 1 
// 若 有 take () 线程 陷入 阻塞 ， 则 该 操作 激活 take () 线程, 继续 进行 取 元 素 操作 。 
/ CR take ) 线程 陷入 阻塞 ， 则 该 操作 无 意义 。 
notEmpty.signal(); 
} 
[+e 
*Circularly increment 1. 
Pi 
final int inc(int i) { 
// 此 处 可 以 看 到 使 用 了 循环 队列 
return (++i == items.length)? 0 : i; 


} 
take () 方法 代码 如 下 。take 操 作 和 put 操 作 相 反 ， 故 不 作 详 细 介 


7J 
绍 。 


代码 清单 5-59 take 方法 源 代码 
public E take() throws InterruptedException{ 
final ReentrantLock lock = this.lock; 
lock. lockInterruptibly ();//%04 
try{ 
try{ 
// 当 队列 空 时 ， 调 用 notEmpty,await () 方 法 ， 使 该 线程 阻塞 。 
// 直 到 take 掉 某 个 元 素 后 ， 调 用 notEmpty,signal () 方 法 激活 该 线程。 
while (count == 0) 
notEmpty.await(); 


}catch (InterruptedException ie) { 


notEmpty.signal();//propagate to non-interrupted thread 
throw ie; 

} 

| /取出 队 头 元 素 

E x = extract(); 

return X; 

}finally{ 

lock. unlock () ; // #4 

} 

} 


extract () 方法 如 下 所 示 。 


代码 清单 5-60 extract 方法 源 代码 
* Extracts element at current take position, advances, and signals. 
*Call only when holding lock. 
*j 
private E extract () { 
final E[] items = this.items; 
E x = items[takeIndex]; 
items [takeIndex] = null; 
takeIndex = inc(takeIndex) ; 
--count; 
notFull.signal(); 
return x; 


} 


从 上 面 的 源 代码 可 以 看 出 ， 在 进行 put 和 take 操 作 时 共用 同一 个 锁 
对 象 。 也 即 是 说 , put 和 take 无 法 并 行 执行 。 
5.4.5.2 LinkedBlockingQueue 


这 是 一 个 基于 链表 的 阻塞 队列 ， 与 ArrayListBlockingQueue 类 似 ， 
它 实现 了 BlockingQueue 接 口 ， 内 部 也 维持 着 一 个 数据 缓冲 队列 (该 队 
列 由 一 个 链表 构成 ， 当 生产 者 往 队 列 中 放 入 一 个 数据 时 ， 队 列 会 从 
生产 者 手中 获取 数据 ， 并 缓存 在 队列 内 部 ， 而 生产 者 立即 返回 ; 只 有 
当 队 列 缓冲 区 达到 最 大 值 缓存 容器 时 (LinkedBlockingQueue 可 以 通过 
构造 函数 指定 该 值 ， 默 认 不 限制 大 小 ) ， 才 会 阻塞 生产 者 队列 ， 知 道 
消费 者 从 队列 中 消费 掉 一 个 数据 ， 生 产 者 线程 才 会 被 唤醒 。 

由 于 LinkedBlockingQueue 实 现 是 线程 安全 的 ， 实 现 了 先进 先 出 等 
特性 ， 是 作为 生产 者 消费 者 的 首选 ，LinkedBlockingQueue 可 以 指定 容 
量 ， 也 可 以 不 指定 ， 不 指定 的 话 ， 默 认 最 大 是 IntegerMAX_VALUE， 
其 中 主要 用 到 put 和 take 方 法 ，put 方 法 在 队列 满 的 时 候 会 阻塞 直到 有 队 
列 成 员 被 消费 ，take 方 法 在 队列 空 的 时 候 会 阻塞 ， 直 到 有 队列 成 员 被 放 
进来 。 


代码 清单 5-61 BlockingQueue 测试 
import java.util.concurrent.BlockingQueue; 


import java.util.concurrent.ExecutorService; 


import java.util.concurrent.Executors; 


import java.util.concurrent.LinkedBlockingQueue; 


[** 
* 多 线程 模拟 实现 生产 者 / 消费 者 模型 
wy 
public class BlockingQueueTest2 { 
/** 
* 定义 装 苹果 的 篮子 
RJ 
public class Basket { 
// 篮子 ， 能 够 容纳 3 个 苹果 


BlockingQueue<String> basket = new LinkedBlockingQueue<String> (3); 


// 生产 苹果 ， 放 入 篮子 

public void produce() throws InterruptedException { 
// put 方法 放 入 一 个 苹果 ， 若 basket 满 了 ， 等 到 basket 有 位 置 
basket.put("An apple"); 


// 消费 苹果 ， 从 篮子 中 取 走 
public String consume() throws InterruptedException { 
// take 方法 取出 一 个 苹果 ， 若 basket AE, FF) basket 有 苹果 为 止 (获取 并 移 除 此 队列 的 头 部 ) 


return basket.take(); 


// 定义 苹果 生产 者 
class Producer implements Runnable ( 
private String instance; 


private Basket basket; 


public Producer(String instance, Basket basket) { 
this.instance - instance; 


this.basket - basket; 


public void run() { 
try ( 
while (true) { 

// 生产 苹果 
System.out .Println(" 生 产 者 准备 生产 苹果 : " + instance); 
basket.produce(); 
System.out .ptrintln("! 生 产 者 生产 革 果 完毕 : " + instance); 
// 休眠 300ms 
Thread.sleep (300); 


} 
} catch (InterruptedException ex) { 
System.out.println("Producer Interrupted") ; 


// 定义 苹果 消费 者 
class Consumer implements Runnable { 
private String instance; 


private Basket basket; 


public Consumer(String instance, Basket basket) { 
this.instance - instance; 


this.basket = basket; 


public void run() { 
try { 
while (true) ( 
// 消费 苹果 
System.out.println ("消费 者 准备 消费 苹果 : " + instance); 
System.out.println(basket.consume()); 


System.out .println("! 消 费 者 消费 苹果 完毕 : " + instance); 
// 休眠 1000ms 
Thread.sleep(1000); 
} 
} catch (InterruptedException ex) { 


System.out.println("Consumer Interrupted") ; 


public static void main(String[] args) { 
BlockingQueueTest2 test = new BlockingQueueTest2(); 


// 建立 一 个 装 苹果 的 篮子 
Basket basket = test.new Basket(); 


ExecutorService service - Executors.newCachedThreadPool(); 

Producer producer - test.new Producer ("生产 者 001"， basket); 

Producer producer2 - test.new Producer ("生产 者 002", basket); 
Consumer consumer = test.new Consumer ("if ## 001", basket); 
service.submit (producer); 

service.submit (producer2); 


service.submit (consumer); 


LinkedBlockingQueue 是 大 小 不 定 的 BlockingQueue， 若 其 构造 疯 数 
带 一 个 规定 大 小 的 参数 ， 生 成 的 BlockingQueue 有 大 小 限制 ， 若 不 带 大 
小 参数 ， 所 生成 的 BlockingQueue 的 大 小 由 Integer.MAX_VALUE 来 决 
定 。 其 所 含 的 对 象 是 以 FIFO 顺 序 排序 的 。 基 于 链表 的 阻塞 队列 ， 同 
ArrayListBlockingQueue 类 似 ， 其 内 部 也 维持 着 一 个 数据 缓冲 队列 (该 
队列 由 一 个 链表 构成 ， 当 生产 者 将 数据 放 入 队列 中 时 ， 队 列 会 从 生 
产 者 手中 获取 数据 ， 并 缓存 在 队列 内 部 ， 而 生产 者 立即 返回 ; RAY 
队列 缓冲 区 达到 最 大 值 缓存 容量 时 (LinkedBlockingQueue 可 以 通过 构 
IGE) ， 才 会 阻塞 生产 者 队列 ， 直 到 消费 者 从 队列 中 消费 
掉 一 份 数 据 ， 生 产 者 线程 会 被 唤醒 ， 反 之 对 于 消费 者 这 端的 处 理 也 基 
于 同样 的 原理 。 而 LinkedBlockingQueue 之 所 以 能 够 高 效 的 处 理 并 发 数 
据 ， 还 因为 其 对 于 生产 者 端 和 消费 者 端 分 别 采 用 了 独立 的 锁 来 控制 数 
据 同 步 ， 这 也 意味 着 在 高 并 发 的 情况 下 生产 者 和 消费 者 可 以 并 行 地 操 
作 队 列 中 的 数据 ， 以 此 来 提高 整个 队列 的 并 发 性 能 。 作 为 开发 者 ， 我 
们 需要 注意 的 是 ， 如 果 构 造 一 个 LinkedBlockingQueue 对 象 ， 而 没有 指 
定 其 容量 大 小 ，LinkedBlockingQueue 会 默认 一 个 类 似 无 限 大 小 的 容量 

(Integer.MAX_VALUE) ， 这 样 的 话 ， 如 果 生 产 者 的 速度 一 旦 大 于 消 

费 者 的 速度 ， 也 许 还 没有 等 到 队列 满 阻塞 产生 ， 系 统 内 存 就 有 可 能 
被 消耗 列 尽 了 。ArrayBlockingQueue 和 LinkedBlockingQueue 是 两 个 最 普 
通 也 是 最 常用 的 阻塞 队列 ， 一 般 情 况 下 ， 在 处 理 多 线程 间 的 生产 者 消 
费 者 问题 ， 使 用 这 两 个 类 足 矣 。 

LinkedBlockingQueue 和 ArrayBlockingQueue 比 较 起 来 ， 它 们 背后 所 
用 的 数据 结构 不 一 样 ， 导 致 LinkedBlockingQueue 的 数据 吞吐 量 要 大 于 
ArrayBlockingQueue ， 但 在 线程 数量 很 大 时 其 性 能 的 可 预见 性 低 于 
ArayBlockingQueueo 

基于 链表 的 阻塞 队列 ， 同 ArrayListBlockingQueue 类 似 ， 其 内 部 也 
维持 着 一 个 数据 缓冲 队列 《该 队列 由 一 个 链表 构成 ) ， 当 生产 者 往 队 
列 中 放 入 一 个 数据 时 ， 队 列 会 从 生产 者 手中 获取 数据 ， 并 缓存 在 队列 
内 部 ， 而 生产 者 立即 返回 ; 只 有 当 队 列 缓冲 区 达到 最 大 值 缓存 容量 时 

(LinkedBlockingQueue 可 以 通过 构造 函数 指定 该 值 ) ， 才 会 阻塞 生产 

者 队列 ， 直 到 消费 者 从 队列 中 消费 掉 一 份 数据 ， 生 产 者 线程 会 被 唤 
醒 ， 反 之 对 于 消费 者 这 端的 处 理 也 基于 同样 的 原理 。 而 
LinkedBlockingQueue 之 所 以 能 够 高 效 的 处 理 并 发 数据 ， 还 因为 其 对 于 


生产 者 端 和 消费 者 端 分 别 采用 了 独立 的 锁 来 控制 数据 同步 ， 这 也 意味 
着 在 高 并 发 的 情 nc ute EI EE 
以 此 来 提高 整个 队列 的 并 发 性 能 。 

作为 开发 者 ， 我 们 需要 注意 的 是 ， nad 
LinkedBlockingQueue X R, 而 没有 指定 其 容量 大 小 ， 
LinkedBlockingQueue 会 默认 一 个 类 似 无 限 大 小 的 容量 
(Integer. MAX_VALUE) , 这 样 的 话 ， 如 果 生 产 者 的 速度 一 旦 大 于 消 
费 者 的 速度 ， 也 许 还 没有 等 到 队列 满 阻 塞 产 生 ， 系 统 内 存 就 有 可 能 已 
被 消耗 列 尽 了 。 

LinkedBlockingQueue 类 中 定义 的 变量 如 下 所 示 。 


代码 清单 5-62 LinkedBlocingQueue 中 定义 的 变量 
/xx The capacity bound, or Integer.MAX VALUE if none */ 
private final int capacity; 
/xx Current number of elements */ 
private final AtomicInteger count = new AtomicInteger (0); 
/xx Head of linked list */ 
private transient Node<E> head; 
/xx Tail of linked list */ 


private transient Node<E> last; 

/xx Lock held by take, poll, etc */ 

Private final ReentrantLock takeLock = new ReentrantLock(); 
/xx Wait queue for waiting takes */ 

private final Condition notEmpty = takeLock.newCondition(); 
/xx Lock held by put, offer, etc */ 


private final ReentrantLock putLock = new ReentrantLock(); 


/xx Wait queue for waiting puts */ 


private final Condition notFull = putLock.newCondition(); 


该 类 中 定义 了 两 个 ReentrantLock 锁 ， 即 putLock 和 takeLock， 它 们 
分 别 用 于 put 端 和 take 端 。 也 就 是 说 ， 生 成 端 和 消费 端 各 自 独 立 拥有 一 


把 锁 ， 避 免 了 读 (take 写 (put) 时 互相 竞争 锁 的 情况 。 


代码 清单 5-63 put HARRE 

/** 

* Inserts the specified element at the tail of this queue, waiting if 
* necessary for space to become available. 

*/ 

public void put (E e) throws InterruptedException{ 

if (e == null) throw new NullPointerException(); 

//Note: convention in all put/take/etc is to preset local var 

//holding count negative to indicate failure unless set. 

int c = -1; 

final ReentrantLock putLock = this.putLock; 

final AtomicInteger count = this.count; 

putLock. lockInterruptibly () ;//4 putLock 4 

try{ 

/* 

* Note that count is used in wait guard even though it is 

* not protected by lock. This works because count can 

* only decrease at this point (all other puts are shut 

* out by lock), and we (or some other waiting put) are 

* signalled if it ever changes from 

* capacity. Similarly for all other uses of count in 

* other wait guards. 

*/ 

// 当 队列 满 时 ， 调 用 notFull.await () 方 法 释放 锁 ， 陷 入 等 待 状态 。 

// 有 两 种 情况 会 激活 该 线程 

// 第 一 、 某 个 put 线程 派 加 元 素 后 ， 发 现 队列 有 空余 ， 就 调用 notFull ,signal () 方 法 激活 阻塞 线程 

// 第 二 、take 线程 取 元 素 时 ，, 发现 队列 已 满 。 则 其 取出 元 素 后 ， 也 会 调用 notFull ,signal () 方 法 激活 阻 
RAS 

while (count.get() == capacity) ( 

notFull.await(); 

} 

| [ok e 添加 到 队列 中 (BUE) 

enqueue (e) ; 


C = count.getAndIncrement () ; 


// 发 现 队列 未 满 ， 调 用 notFul1.signal () 激 活 阻塞 的 put 线程 (可 能 存在 ) 
if (c + 1 < capacity) 

notFull.signal(); 

finally( 

putLock.unlock(); 


if (c == 0){ 
// 队 列 空 ， 说 明 已 经 有 take 线程 陷入 阻塞 ， 故 调用 signalNotEmpty 激活 阻塞 的 take 线程 
signalNotEmpty () ; 


enqueue (Ee) 方法 如 下 所 示 。 


代码 清单 5-64 equeue 方法 源 代码 
/ 
* Creates a node and links it at end of queue. 
* (param x the item 
ty 
05.private void enqueue (E x) { 
// assert putLock.isHeldByCurrentThread () ; 
last = last.next = new Node<E>(x); 
08.} 


take () 方法 代码 如 下 。take 操 作 和 put 操 作 相 反 ， 故 不 作 详细 介 


7J 
绍 。 


代码 清单 5-65 take 方法 源 代码 
public E take() throws InterruptedException{ 
E x; 

int c = -1; 


£f 


final AtomicInteger count = this.count; 


g 


final ReentrantLock takeLock = this.takeLock; 


dis 


takeLock.lockInterruptibly(); 


try{ 

while (count.get ()==0) { 
notEmpty.await (); 

} 

x = dequeue (); 

c= count.getAndDecrement () ; 
if (c > 1) 
notEmpty.signal(); 

finally ( 
takeLock.unlock(); 


if (c == capacity) 
signalNotFull(); 
return x; 


} 


dequeue () 方法 如 下 所 示 。 


代码 清单 5-66 dequeue 方法 源 代码 
/** 
* Removes a node from head of queue. 
* @return the node 
ey 
private E dequeue() { 
//assert takeLock.isHeldByCurrentThread () ; 
Node<E> h = head; 
Node<E> first = h.next; 
h.next = h; // help GC 
head = first; 
E x = first.item; 
first.item = null; 
return X; 


} 


小 结 : take 和 put 操 作 各 有 一 把 锁 ， 可 并 行 读 取 。 

5.4.5.3 DelayQueue 

假设 我 们 有 这 么 一 个 工作 场景 。 服 务 器 里 面 有 很 多 客户 端的 连 
接 ， 空 闲 一 段 时 间 之 后 需要 逐一 关闭 。 一 种 可 行 的 方法 是 使 用 一 个 后 
台 线 程 ， 人 遍历 所 有 连接 ， 然 后 挨个 检查 、 关 闭 。 这 种 笨 条 的 办 法 简单 
好 用 ， 但 是 对 象 数 量 过 多 时 ， 可 能 存在 性 能 问题 ， 检 查 间隔 时 间 不 好 
设置 ， 间 隔 时 间 过 大 ， 影 响 精确 度 ， 多 小 则 存在 效率 问题 ， 而 且 做 不 
到 按 超 时 的 时 间 顺 序 处 理 。 总 的 来 说 ， 这 种 场景 使 用 DelayQueue 最 适 
a 
合 了 。 

DelayQueue 是 一 个 BlockingQueue ， 其 特 化 的 参数 是 Delayed。 
Delayed 扩 展 了 Comparable 接 口 ， 比 较 的 基准 为 延 时 的 时 间 值 ，Delayed 
接口 的 实现 类 getDelay 的 返回 值 应 为 固定 值 (final) 。DelayQueue 内 部 
是 使 用 PriorityQueue 实 现 的 。 所 以 我 们 可 以 用 一 个 公式 概括 这 些 组 成 因 
素 ， 即 DelayQueue=BlockingQueue+PriorityQueue+Delayed。 可 以 这 人 么 


说 DelayQueue 是 一 个 使 用 优先 队列 (PriorityQueue) 实现 的 
BlockingQueue， 优 先 队 列 的 比较 基准 值 是 时 间 。 

DelayQueue 内 部 的 实现 使 用 了 一 个 优先 队列 。 当 调用 DelayQueue 
的 offer 方 法 时 ， 把 Delayed 对 象 加 入 到 优先 队列 g 中 ， 代 码 如 下 所 示 。 


代码 清单 5-67 DelayQueue 的 Offer 方法 源 代码 
public boolean offer(E e) ( 

final ReentrantLock lock = this.lock; 

lock.lock(); 

try { 
E first = g.peek(); 
q.offer (e); 
if (first == null || e.compareTo (first) < 0) 

available.signalAll(); 


return true; 


} finally ( 


lock.unlock(); 


} 


DelayQueue 的 take 方 法 ， 把 优先 队列 q 的 first 拿 出 来 (peek) , WR 
没有 达到 延 时 疝 值 ， 则 进行 await 处 理 ， 代 码 如 下 所 示 。 


代码 清单 5-68 DelayQueue 的 take 方法 源 代码 
public E take() throws InterruptedException { 
final ReentrantLock lock = this.lock; 


lock.lockInterruptibly(); 


try { 
for (77) { 
E first = q.peek() ; 
if (first == null) { 
available.await(); 
| else | 
long delay = first.getDelay (TimeUnit.NANOSECONDS) ; 
if (delay > 0) { 
long tl = available. awaitNanos (delay); 
} else { 
E x = q.poll(); 
assert x != null; 
if (q.size() != 0) 
available.signalAll(); // wake up other takers 
return x; 
| 
} 
} 
} finally { 


lock. unlock (); 


} 


DelayQueue 中 的 元 素 只 有 当 其 指定 的 延迟 时 间 到 了 ， 才 能 够 从 队 
列 中 获取 到 该 元 素 。DelayQueue 是 一 个 没有 大 小 限制 的 队列 ， 因 此 往 
队列 中 插入 数据 的 操作 (生产 者 ) 永远 不 会 被 阻塞 ， 而 只 有 获取 数据 


的 操作 (消费 者 ) 才 会 被 阻塞 。DelayQueue 使 用 场景 较 少 ， 但 都 相当 
巧妙 。 

我 们 来 模拟 一 个 示例 ， 假 设 模拟 一 个 考试 ， 考 试 时 间 为 120 分 钟 ， 
30 分 钟 后 才 可 交卷 ， 当 时 间 到 了 ， 或 学 生 都 交 完 卷 了 考试 结束 。 用 
DelayQueue 人 存储 考生 (Student 类 ) ， 每 一 个 考生 都 有 自 
成 试卷 的 时 间 ， Teacher EE Xf DelayCueueiit 7 控 ， 收 取 完 成 试卷 小 
于 120 分 钟 的 学 生 的 试卷 。 当 考试 时 间 120 分 钟 到 时 ， 先 关闭 Teacher 线 
程 ， 然后 强制 DelayQueue 中 还 存在 的 考生 交 卷 。 每 一 个 考生 交卷 都 会 
进行 一 次 countDownLatch.countDown () ， 当 countDownLatch.await 
() 不 再 阻塞 说 明 所 有 考生 都 交卷 了 ， 判 断 结 束 后 结束 考试 。 代 码 如 
下 所 示 。 


代码 清单 5-69 DelayQueue 示例 
import java.util.Iterator; 
import java.util.Random; 
import java.util.concurrent.CountDownLatch; 
import java.util.concurrent.Delayed; 
import java.util.concurrent.DelayQueue; 
import java.util.concurrent.Delayed; 


import java.util.concurrent.TimeUnit; 


public class examinationClass { 
public static void main(String[] args) throws InterruptedException { 

// TODO Auto-generated method stub 
int studentNumber - 20; 
CountDownLatch countDownLatch = new CountDownLatch (studentNumber+1) ; 
DelayQueue< Student> students = new DelayQueue<Student>(); 
Random random = new Random(); 
for (int i = 0; i < studentNumber; i++) { 

students.put (new Student ("student"+ (i+1), 30+random.nextInt (120) , countDownLatch) ) ; 
} 
Thread teacherThread =new Thread (new Teacher (students) ); 
students .put (new EndExam(students, 120,countDownLatch, teacherThread) ) ; 
teacherThread.start(); 
countDownLatch.await(); 
System.out.println(" 考试 时 间 到 ， 全 部 交卷 ! "); 


class Student implements Runnable,Delayed( 


private String name; 

private long workTime; 

private long submitTime; 
private boolean isForce - false; 


private CountDownLatch countDownLatch; 
public Student () {} 


public Student (String name,long workTime,CountDownLatch countDownLatch) { 
this.name = name; 
this.workTime = workTime; 
this.submitTime = TimeUnit.NANOSECONDS.convert (workTime, 
TimeUnit.NANOSECONDS)-*System.nanoTime(); 


this.countDownLatch = countDownLatch; 


@Override 
public int compareTo(Delayed o) { 
// TODO Auto-generated method stub 


if(o == null || ! (o instanceof Student)) return 1; 
if(o == this) return 0; 
Student s = (Student) o; 
if (this.workTime > s.workTime) { 
return 1; 
}else if (this.workTime == s.workTime) { 
return 0; 
Jelse { 


return -1; 


@Override 
public long getDelay(TimeUnit unit) { 
// TODO Auto-generated method stub 
return unit.convert(submitTime - System.nanoTime(), TimeUnit.NANOSECONDS) ; 
) 


@Override 
public void run() { 
// TODO Auto-generated method stub 
if (isForce) { 
System.out.println(name + " 交卷 ,希望 用 时 " + workTime + "分 钟 "+" ,实际 用 
时 120 4h" ); 
}else { 
System.out.println(name + " 交卷 ,希望 用 时 " + workTime + "分 钟 "+" ,实际 用 
时 "+workTime +" 24b"); 
} 


countDownLatch.countDown(); 


public boolean isForce() ( 


return isForce; 


public void setForce(boolean isForce) { 


this.isForce - isForce; 


class EndExam extends Student( 
private DelayQueue<Student> students; 
private CountDownLatch countDownLatch; 


private Thread teacherThread; 


public EndExam(DelayQueue«Student» students, long workTime, CountDownLatch 


countDownLatch,Thread teacherThread) { 
super ("4k #) KR", workTime,countDownLatch); 
this.students = students; 
this.countDownLatch = countDownLatch; 


this.teacherThread = teacherThread; 


@Override 
public void run() { 
// TODO Auto-generated method stub 


teacherThread.interrupt(); 
Student tmpStudent; 
for (Iterator<Student> iterator2 = students.iterator(); iterator2. 
hasNext();) { 

tmpStudent = iterator2.next(); 
tmpStudent.setForce (true); 
tmpStudent.run(); 

) 


countDownLatch.countDown(); 


class Teacher implements Runnable( 


private DelayQueue<Student> students; 
public Teacher (DelayQueue<Student> students) { 
this.students = students; 


@Override 
public void run() { 
// TODO Auto-generated method stub 
try { 
while (!Thread.interrupted() ) { 
students.take().run(); 
) 
) catch (Exception e) ( 
// TODO: handle exception 
e.printStackTrace(); 


在 我 们 第 4 章 提 到 过 的 Hbase 中 ，Lease 就 是 以 一 个 DelayQueue 存 放 
的 。 比 如 说 一 个 当 Client 扫 描 数 据 表 的 时 候 ， 首 先 会 找到 扫描 startkey 所 
TE BS Region, ， 构 建 RegionScanner ， 将 通过 RegionScanner 加 入 一 个 
delayQueue , 以 及 维护 一 个 scannerId 到 RegionScanner 的 Map o 
HRegionServer 启 动 的 时 候 会 起 一 个 Leases 的 守护 线程 ， 时 刻 监 听 
delayQueue 的 元 素 ， 当 有 过 期 时 将 其 从 Map 中 移 除 ， 从 而 达到 Leases 的 
作用 。 

5.4.5.4 PriorityBlockingQueue 

PriorityBlockingQueue 类 似 于 LinkedBlockingQueue， 但 其 所 含 对 象 
的 排序 不 是 FIFO， 而 是 依据 对 象 的 自然 排序 顺序 或 者 是 构造 水 数 所 带 
的 Comparator 决 定 的 顺序 。 一 个 无 界 的 阻塞 队列 ， 它 使 用 与 类 
PriorityQueue 相同 的 顺序 规则 ， 并 且 提供 了 阻塞 检索 的 操作 。 虽 然 此 
队列 逻辑 上 是 无 界 的 ， 但 是 由 于 资源 被 耗 尽 ， 所 以 试图 执行 添加 操作 
可 能 会 失败 (导致 OutOfMemoryError) 。 此 类 不 允许 使 用 null 元 素 。 
依赖 自然 顺序 的 优先 级 队列 也 不 允许 插入 不 可 比较 的 对 象 (因为 这 样 
做 会 抛 出 ClassCastException) o 

PriorityBlockingQueue 是 基于 优先 级 的 阻塞 队列 (优先 级 的 判断 通 
id #4 ie EK ZA f£ A BY Compator WRK RE) ， 但 需要 注意 的 是 
PriorityBlockingQueue 并 不 会 阻塞 数据 生产 者 ， 而 只 会 在 没有 可 消费 的 
数据 时 ， 阻 塞 数据 的 消费 者 。 因 此 使 用 的 时 候 要 特别 注意 ， 生 产 者 生 
产 数据 的 速度 绝对 不 能 快 于 消费 者 消费 数据 的 速度 ， 否 则 时 间 一 长 ， 
会 最 终 耗 尺 所 有 的 可 用 扒 内 存 空间 。 在 实现 PriorityBlockingQueue 时 ， 
内 部 控制 线程 同步 的 锁 采 用 的 是 公平 锁 。 

下 面 这 个 示例 (JDK8 不 支持 ) 我 们 对 比 了 返回 的 Entity， 可 以 确定 


Priorityo 


代码 清单 5-70 PriorityBlockingQueue 示例 程序 


NES 


import java.util.Random; 


de 


import java.util.concurrent.ExecutorService; 


Im 


import java.util.concurrent.Executors; 


m 


import java.util.concurrent.PriorityBlockingQueue; 


import java.util.concurrent.TimeUnit; 


public class PriorityBlockingQueueDemo { 


static Random r-new Random(47); 


public static void main(String args[]) { 
final PriorityBlockingQueue q= new PriorityBlockingQueue(); 
ExecutorService se=Executors.newCachedThreadPool (); 
//execute producer 
se.execute (new Runnable () { 
public void run() { 
int i20; 
while (true) { 
q.put (new PriorityEntity(r.nextInt(10),itt+)); 
try { 
TimeUnit.MILLISECONDS.sleep(r.nextInt (1000)); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


); 


//execute consumer 
se.execute (new Runnable() { 
public void run() { 
while (true) { 
try { 
System. out .println ("take-- "4q.take()*" left:-- ["+q.toString()+"]"); 
try { 
TimeUnit .MILLISECONDS.sleep(r.nextInt (1000) ); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 
e.printStackTrace(); 
) 
} catch (InterruptedException e) { 
e.printStackTrace(); 


); 

try ( 
TimeUnit.SECONDS.sleep(5); 

) catch (InterruptedException e) { 
// TODO Auto-generated catch block 
e.printStackTrace(); 

} 

System.out.printin ("shutdown"); 


class PriorityEntity implements Comparable<PriorityEntity> { 
private static int count=0; 
private int id=count++; 
private int priority; 


private int index-0; 


public PriorityEntity(int  priority,int index) { 
this.priority - priority; 


this.index- index; 


public String toString() { 
return id+"# [index="+index+" priority="+priority+"]"; 


| 


/ /数字 小 ， 优 先 级 高 
public int compareTo (PriorityEntity o) { 
return this.priority > o.priority ? 1 
è thiis prlority < epnoeniy?-13 0 


} 


| /数字 大 ， 优 先 级 高 
public int compareTo (PriorityTask 0) { 
return this.priority < o.priority ? 1 
| this.prériby > 0.prionty 7? -1 & Dj 
} 
} 


注意 ， PriorityBlockingQueue 里 面 存 储 的 对 象 必 须 是 实现 
Comparable 接 口 。 队 列 通过 这 个 接口 的 Compare 方 法 确定 对 象 的 
Priority， 具 体 规则 是 当 与 其 他 对 象 比较 时 ， 如 果 Compare 方 法 返回 负 
数 ， 那 么 在 队列 里 面 的 优先 级 就 比较 高 。 

5.4.5.5 SynchronousQueue 


SynchronousQueue 是 一 种 特殊 的 BlockingQueue， 对 其 的 操作 必须 
是 放 和 取 交 蔡 完 成 的 。 它 是 一 种 无 缓冲 的 等 竺 队列， 类似 于 无 中 介 的 
直接 交易 ， 这 一 点 有 点 像 原 始 社会 中 的 生产 者 和 消费 者 ， 生 产 者 拿 着 
产品 去 集 市 销售 给 产品 的 最 终 消 费 者 ， 而 消费 者 必须 亲自 去 集 市 找到 
所 要 商品 的 直接 生产 者 ， 如 果 一 方 没有 找到 合适 的 上 目标， 那么 对 不 
起 ， 大 家 都 在 集 市 等 待 。 相 对 于 有 缓冲 的 BlockingQueue 来 说 ， 这 样 的 
设计 方式 减少 了 一 个 中 间 经 销 商 的 环节 (缓冲 区 ) ， 如 果 有 经 销 商 ， 
生产 者 直接 把 产品 批发 给 经 销 商 ， 而 无 须 在 意 经 销 商 最 终 会 将 这 些 产 
品 卖 给 那些 消费 者 ， 由 于 经 销 商 可 以 库存 一 部 分 商品 ， 因 此 相对 于 直 
接 交 易 模 式 ， 总 体 来 说 采用 中 间 经 销 商 的 模式 会 吞吐 量 高 一 些 (可 以 
批量 买卖 ; 但 另 一 方面 ， 又 因为 经 销 商 的 引入 ， 使 得 产品 从 生产 者 


到 消费 者 中 间 增 加 了 额外 的 交易 环节 ， 单 个 产品 的 及 时 响应 性 能 可 能 
会 降低 。 

从 上 面 的 描述 我 们 可 以 得 出 ，SynchronousQueue 是 这 样 一 种 阻塞 队 
列 ， 它 的 每 个 put 必 须 等 待 一 个 take， 反 之 亦 然 。 同 步 队 列 没有 任何 内 
部 容量 ， 甚 至 连 一 个 队列 的 容量 都 没有 。 除 非 另 一 个 线程 试图 移 除 某 
个 元 素 ， 否 则 也 不 能 (使 用 任何 方法 ) 添加 元 素 ; 也 不 能 迭代 队列 ， 
因为 其 中 没有 元 素 可 用 于 迭代 。 队 列 的 头 是 尝试 添加 到 队列 中 的 首 个 
已 排队 线程 元 素 ， 如 果 没 有 已 排队 线程 ， 则 不 添加 元 素 并 且 头 为 Null。 

SynchronousQueue 内 部 没有 容量 ， 但 是 由 于 一 个 插入 操作 总 是 对 应 
一 个 移 除 操作 ， 反 过 来 同样 需要 满足 。 那 么 一 个 元 素 就 不 会 在 
SynchronousQueue 里 面 长 时 间 停 留 ， 一 旦 有 了 插入 线程 和 移 除 线程 ， 
元 素 很 快 就 从 插入 线程 移交 给 移 除 线程 。 也 就 是 说 这 更 像 是 一 种 信道 

(管道 ) ， 资 源 从 一 个 方向 快速 传递 到 另 一 方向 。 

需要 特别 说 明 的 是 ， 尽 管 元 素 在 SynchronousQueue 内 部 不 会 “ 停 
留 ”， 但 是 并 不 意味 着 SynchronousQueue 内 部 没有 队列 。 实 际 上 
SynchronousQueue 维护 者 线程 队列 ， 也 就 是 插入 线程 或 者 移 除 线程 在 
不 同时 存在 的 时 候 就 会 有 线程 队列 。 既 然 有 队列 ， 同 样 就 有 公平 性 和 
非 公平 性 特性 ， 公 平 性 保证 正在 等 待 的 插入 线程 或 者 移 除 线程 以 FIFO 
的 顺序 传递 资源。 显然 这 是 一 种 快速 传递 元 素 的 方式 ， 也 就 是 说 在 这 
种 情况 下 元 素 总 是 以 最 快 的 方式 从 插入 者 (生产 者 ) 传递 给 移 除 者 

(消费 者 ) ， 这 在 多 任务 队列 中 是 最 快 处 理 任务 的 方式 。 

声明 一 个 SynchronousQueue 有 两 种 不 同 的 方式 ， 即 公平 模式 和 非 公 
平 模式 ， 它 们 之 间 有 着 不 太一 样 的 行为 。 

m 如 果 采 用 公平 模式 : SynchronousQueue 会 采用 公平 锁 ， 并 配合 一 
个 FIFO 队 列 来 阻塞 多 余 的 生产 者 和 消费 者 ， 从 而 体系 整体 的 公平 策 
BR ; 

m 但 如 果 是 非 公 平 模式 (SynchronousQueue 默认 ) 
SynchronousQueue 采 用 非 公 平 锁 ， 同 时 配合 一 个 LIFO 队 列 来 管理 多 余 
的 生产 者 和 消费 者 ， 而 后 一 种 模式 ， 如 果 生 产 者 和 消费 者 的 处 理 速度 
有 差距 ， 则 很 容易 出 现 饥 竟 的 情况 ， 即 可 能 有 某 些 生产 者 或 者 是 消费 
者 的 数据 永远 都 得 不 到 处 理 。 

我 们 来 看 一 个 SynchronousQueue 的 简单 使 用 示例 ， 代 码 如 下 所 示 。 


代码 清单 5-71 SynchronousQueue 示例 程序 
import java.util.Random; 
import java.util.concurrent.SynchronousQueue; 


import java.util.concurrent.TimeUnit; 


public class SynchronousQueueDemo { 
public static void main(String[] args) { 
SynchronousQueue<Integer> queue = new SynchronousQueue<Integer>(); 
new Customer (queue) . start () ; 


new Product (queue) .start () ; 


static class Product extends Thread{ 
SynchronousQueue<Integer> queue; 
public Product (SynchronousQueue<Integer> queue) { 
this.queue = queue; 
} 
@Override 
public void run() { 
while (true) { 
int rand = new Random().nextInt (1000); 
System.out,println ("生产 了 一 个 产品 ; "+rand); 
System,out .println ("等 待 三 秒 后 运送 出 去 ,,,")，; 
try { 
TimeUnit.SECONDS.sleep(3); 
) catch (InterruptedException e) { 
e.printStackTrace(); 
} 


queue. offer (rand) ; 


static class Customer extends Thread{ 
SynchronousQueue<Integer> queue; 
public Customer (SynchronousQueue<Integer> queue) { 
this.queue = queue; 
} 
@Override 
public void run() { 
while (true) { 
try { 
System,out ,println(" 消 费 了 一 个 产品 ;"+queue ,take () ) ; 
) catch (InterruptedException e) { 
e.printStackTrace(); 
} 
oo ur 
} 


} 
输出 如 下 所 示 。 


代码 清单 5.72 ”SynchronousQueue 示例 程序 运行 输出 
生产 了 一 个 产品 ,618 
等 待 三 秒 后 运送 出 去 ,,， 
生产 了 一 个 产品 ,765 
等 待 三 秒 后 运送 出 去 ，，， 
消费 了 一 个 产品 : 618 
生产 了 一 个 产品 ,433 
等 待 三 秒 后 运送 出 去 ,,， 
消费 了 一 个 产品 :765 


SynchronousQueue 有 几 个 注意 点 。 
(1) 它 一 种 阻塞 队列 ， 其 中 每 个 put 必 须 等 待 一 个 take， 反 之 亦 
然 。 同 步 队 列 没 有 任何 内 部 容量 ， 甚 至 连 一 个 队列 的 容量 都 没有 。 
(2) 它 是 线程 安全 的 ， 是 阻塞 的 。 
(3) 不 允许 使 用 null 元 素 。 
(4) 公平 排序 策略 是 指 调用 put 的 线程 之 间 ， 或 take 的 线程 之 间 。 
公平 排序 策略 可 以 查考 ArrayBlockingQueue 中 的 公平 策略 。 
5.4.5.6 LinkedTransferQueue 
前 面 一 节 里 介绍 的 BlockingQueue 是 针对 读 取 或 者 写 入 锁定 整个 队 
列 ， 所 以 在 比较 繁忙 的 时 候 各 种 锁 比 较 耗 时 。JDK7 的 并 发 包 里 新 增 一 
个 队列 集合 类 LinkedTransferQueue ， 该 类 继承 自 TransferQueue 接 口 ， 
TransferQueue 继 承 了 BlockingQueue (BlockingQueue 又 继承 了 Queue) 
并 扩展 了 一 些 新 方法 。BlockingQueue (和 Queue) 是 Java 5 中 加 入 的 接 
口 ， 它 是 指 这 样 的 一 个 队列 : 当 生 产 者 向 队列 添加 元 素 但 队列 已 满 
时 ， 生 产 者 会 被 阻塞 ; 当 消 费 者 从 队列 移 除 元 素 但 队列 为 空 时 ， 消 费 
者 会 被 阻塞 。TransferQueue 则 更 进一步 ， 生 产 者 会 一 直 阻 塞 直 到 所 添 
加 到 队列 的 元 素 被 某 一 个 消费 者 所 消费 (不 仅仅 是 添加 到 队列 里 就 完 
事 ) 。 新 添加 的 transfer 方 法 用 来 实现 这 种 约束 。 顾 名 思 义 ， 阻 塞 就 是 
发 生 在 元 素 从 一 个 线程 transfer 到 另 一 个 线程 的 过 程 中 ， 它 有 效 地 实现 


了 元 素 在 线程 之 间 的 传递 〈 以 建立 Java 内 存 模型 中 的 happens-before 关 
系 的 方式 ) 。 

TransferQueue 还 包括 了 其 他 的 一 些 方法 : 两 个 tryTransfer 方 法 ， 一 
个 是 非 阻塞 的 ， 另 一 个 带 有 timeout 人 参数 设置 超时 。 还 有 两 个 辅助 方法 
hasWaitingConsumer () 和 getWaitingConsumerCount () 。 

LinkedTransferQueue 类 在 使 用 volatile 变 量 时 ， 用 一 种 追加 字 节 的 方 
式 来 优化 队列 出 队 和 入 队 的 性 能 。 LinkedTransferQueue 利用 
CompareAndSwap 进 行 一 个 无 阻塞 的 队列 ， 针 对 每 一 个 操作 进行 处 理 。 
从 数据 结构 角度 来 看 ，LinkedTransferQueue 类 的 内 部 保持 着 一 个 栈 ， 基 
本 单位 是 Node， 根 据 hasData 区 分 里 面 有 两 种 元 素 ， 要 么 是 Data 要 么 是 
Reservation ， 不 会 同时 存在 ， 并 且 有 一 个 变量 Head 指 向 最 前 面 的 
Node， 没 东西 则 是 Null。 

LinkedTransferQueue 类 的 完整 存 取 过 程 分 成 两 部 分 : 

曙 原 节点 与 新 节点 的 比较 ， 代 码 如 下 所 示 。 


代码 清单 5-73 原 节 点 与 新 节点 的 比较 

for (;;) {// restart on append race 

for (Node h = head, p = h; p != null;) { // 如 果 头 结 点 为 空 则 跳 过 ， 非 空 进去 找 第 一 个 可 用 
节点 

boolean isData = p.isData; 

Object item = p.item; 

if (item != p && (item != null) == isData) ( // 判断 原 节点 可 用 性 ， 如 data 的 item 应 该 
是 数值 ， 如 果 是 null 则 表明 用 过 了 

if (isData == haveData) // 两 个 节点 是 相同 类 型 ,不 用 match 了 ， 去 下 一 步 

break; 

if (p.casItem(item, e)) ( // 节点 不 同类 型 ，match AXI, 更改 原 节点 item， 表 明 不 可 用 

for (Node q = p; q != h;) {// 什 么 , 我 居然 不 是 head PAT? 我 要 让 它 指 向 我 | 

Node n = q.next; // update by 2 unless singleton 

if (head == h && casHead(h, n == null? q : n)) { 

h.forgetNext () ; 

break; 

)// advance and retry 

if ((h = head) == null ||(q = h.next) == null || !q.isMatched()) 

break; // unless slack « 2 

} 

LockSupport.unpark(p.waiter) ;// 根 据 原 节 点 的 类 型 ,reservation MAK, data 则 叫 null 
Kit 

return LinkedTransferQueue.<E>cast (item) ;// 根 据 原 节点 的 类 型 ,reservation 则 返回 nul1， 
data 则 返回 数据 

} 

] 


Node n = p.next;// 下 一 个 节点 
p= (p!=n)?n: (h= head); // Use head if p offlist 
} 


上 面 的 方法 ， 重 点 目标 是 为 了 找 出 第 一 个 可 用 节点 ， 如 果 是 null 则 
跳 过 ， 如 果 与 进来 的 节点 相同 (本 来 就 有 data， 还 放 data) 也 跳 过 ， 如 
果 不 同 (本 来 是 data ， 现 在 是 reservation ， 返 回 data 值 /本 来 是 
reservation， 现 在 是 data， 叫 人 来 收 货 ， 返 回 reservation 值 = 空 ) o 

m 处 理 节 点 

如 果 比 较 失 败 了 就 会 进入 这 个 环节 ， 然 后 把 新 节点 放 进 栈 内 ， 并 
根据 参数 决定 立刻 返回 或 者 等 待 返回 。 代 码 如 下 所 示 。 


代码 清单 5-74 “处理 节点 

if (how != NOW)(//No matches available 

if (s == null) 

S - new Node(e, haveData); 

Node pred = tryAppend(s, haveData);// WV node 

if (pred == null) 

continue retry; // 不 成 功 则 重 试 整个 过 程 

if (how != ASYNC) 

return awaitMatch(s, pred, e, (how == TIMED)，nanos);// 根 据 参数 ， 等 不 等 别人 放 数 据 ， 
拿 数据 ， 等 多 久 

} 


return e; // not waiting 


LinkedTransferQueue 类 内 部 采用 的 是 一 种 非常 不 同 的 队列 ， 即 松弛 
型 双重 队列 (Dual Queues with Slack) 。 松 弛 的 意思 是 说 ， 它 的 head 和 
tail 节 点 相 较 于 其 他 并 发 列队 要 求 上 更 放松 ， 构 造 它 的 目的 是 减少 CAS 
操作 的 次 数 (相应 的 会 增加 next 域 的 引用 次 数 ) ， 举 个 例子 : 某 个 瞬间 
tail 指 向 的 节点 后 面 已 经 有 6 个 节点 了 (以 下 图 借用 源码 的 注释 ) ， 而 其 
他 并 发 队列 真正 的 尾 节点 最 多 只 能 是 tail 的 下 一 个 节点 。 收 缩 的 方式 是 
大 部 分 情况 下 不 会 用 tail 的 next 来 设置 tail 节 点 ， 而 是 第 一 次 收缩 N 个 next 
(N > =2) ， 然 后 查看 能 否 2 个 一 次 来 收缩 tail。 双 重 是 指 有 两 种 类 型 相 
互 对 立 的 节点 (Node.isData==falselltrue) ， 并 且 我 理解 的 每 种 节点 都 
有 三 种 状态 : 

(1) INIT (节点 构造 完成 ， 刚 进入 队列 的 状态 ) ; 


(2) MATCHED (节点 备 置 为 “满足 ”状态 ， 即 入 队 节 点 标识 的 线 
程 成 功 取得 或 者 传递 了 数据 ) ; 

(3) CANCELED (节点 被 置 为 取消 状态 ， 即 入 队 节点 标识 的 线程 
因为 超时 或 者 中 断 决 定 放 弃 等 待 ) o 

在 队列 中 已 有 元 素 的 情况 下 ， 调 用 transfer 方 法 ， 可 以 确保 队列 中 
被 传递 元 素 之 前 的 所 有 元 素 都 能 被 处 理 。LinkedTransferQueue 实 际 上 是 
ConcurrentLinkedQueue 、 SynchronousQueue (公平 模式 ) 和 
LinkedBlockingQueue 的 超 集 。 而 且 LinkedTransferQueue 更 好 用 ， 因 为 
它 不 仅仅 综合 了 这 几 个 类 的 功能 ， 同 时 也 提供 了 更 高 效 的 实现 。 

前 面 说 过 ，LinkedTransferQueue 类 使 用 一 个 内 部 类 类 型 来 定义 队列 
的 头 节 点 和 尾 节 点 ， 而 这 个 内 部 类 PaddedAtomicReference 相 对 于 父 类 
AtomicReference 只 做 了 一 件 事 情 ， 就 是 将 共享 变量 追加 a 到 64 字 节 。 一 
个 对 象 的 引用 占用 了 4 个 字 节 ， 它 追加 了 15 个 变量 ( 共 占 60 个 字 节 ) ， 
再 加 上 父 类 的 value 变 量 ， 一 共 64 个 字 节 。 这 种 设计 的 原理 是 基于 CPU 
的 原理 ， 处 理 器 的 L1、L2 或 L3 RNS RETEST Sh, Kz 
持 部 分 填充 缓存 行 ， 这 意味 着 ， 如 果 队 列 的 头 节点 和 尾 节 点 都 不 足 64 
字 节 的 话 ， 处 理 器 会 将 它们 都 读 到 同一 个 高 速 缓存 行 中 ， 在 多 处 理 器 
下 每 个 处 理 器 都 会 缓存 同样 的 头 、 尾 节点 ， 当 一 个 处 理 器 试图 修改 头 
节点 时 ， 会 将 整个 缓存 行 锁定 ， 那 么 在 缓存 一 致 性 机 制 的 作用 下 ， 会 
导致 其 他 处 理 器 不 能 访问 自己 高 速 组 存 中 的 尾 节点 ， 而 队列 的 入 队 和 
出 队 操 作 则 需要 不 停 地 修改 关节 点 和 尾 节点 ， 所 以 在 多 处 理 器 的 情况 
下 将 会 严重 影响 到 队列 的 入 队 和 出 队 效 率 。 使 用 追加 到 64 字 节 的 方式 
来 填 满 高 速 缓冲 区 的 缓存 行 ， 避 免 头 节点 和 尾 节 点 加 载 到 同一 个 缓存 
行 ， 使 头 、 尾 节点 在 修改 时 不 会 互相 锁定 。 

注意 : P6 系 统 和 奔腾 处 理 器 ， 由 于 L1 和 L2 高 速 缓存 行 是 32 个 字 节 
宽 ， 所 以 不 适用 于 该 方式 。 此 外 ， 如 果 共 享 变量 不 被 频繁 写 的 话 ， 锁 
的 几率 也 非常 小 ， 所 以 就 没 必 要 通过 追加 字 节 的 方式 来 避免 相互 锁 
定 ， 因 为 使 用 追加 字 节 的 方式 需要 处 理 器 读 取 更 多 的 字 节 到 高 速 缓冲 
区 ， 本 身 就 会 带 来 一 定 的 性 能 消耗 。 

总 的 来 说 ，LinkedTransferQueue 的 性 能 分 别 是 SynchronousQueue 的 
34% 〈 非 公平 模式 ) 和 14 倍 (公平 模式 ) 。 因 为 像 ThreadPoolExecutor 
这 样 的 类 在 任务 传递 时 都 是 使 用 SynchronousQueue ， 所 以 使 用 


LinkedTransferQueue 来 fÈ # SynchronousQueue 也 会 使 得 
ThreadPoolExecutor 得 到 相应 的 性 能 提升 。 考 虑 到 executor 在 并 发 编程 中 
的 重要 性 ， 你 就 会 理解 添加 这 个 实现 类 的 重要 性 了 。Java5 中 的 
SynchronousQueue 使 用 两 个 队列 (一 个 用 于 正在 等 待 的 生产 者 、 另 一 个 
用 于 正在 等 待 的 消费 者 ) 和 一 个 用 来 保护 两 个 队列 的 锁 。 而 
LinkedTransferQueue 使 用 CAS 操 作 〈 译 者 注 : 参考 wiki) 实现 一 个 非 阻 
塞 的 方法 ， 这 是 避免 序列 化 处 理 任 务 的 关键 。[6] 
5.4.5.7 LinkedBlockingDeque 


JDK6 提 供 了 一 种 双 段 队列 (Doubled-Ended Queue) ， 简 称 
Deque。 Deque 人 允许 在 队列 的 头 部 或 者 尾部 进行 出 队 和 入 队 操 作 。 与 
Queue 相 比 ， 它 们 具有 更 加 复杂 的 功能 。 

LinkedList、ArrayDeque 和 LinkedBlockingDeque， 都 实现 了 双 端 队 
列 Deque 接 口 。 其 中 LinkedList 使 用 链表 实现 了 双 端 队列 ，ArrayDeque 
使 用 数组 实现 双 端 队列 。 通 常情 况 下 ， 由 于 ArrayDeque 基 于 数组 实 
现 ， 拥 有 高 效 的 随机 访问 性 能 ， 因 此 ArrayDeque 具 有 更 好 的 遍历 性 
能 。 但 是 当 队 列 的 大 小 变化 较 大 时 ，ArrayDeque 需 要 重新 分 配 内 存 ， 
并 进行 数组 复制 ， 在 这 种 环境 下 ， 基 于 链表 的 LinkedList 没 有 内 存 调整 
和 数据 复制 的 负担 ， 性 能 表现 较 好 。 但 无 论 是 LinkedList 或 者 
ArrayDeque， 它 们 都 不 是 线程 安全 的 。LinkedBlockingDeque 是 一 个 线 
程 安全 的 双 端 队列 实现 ， 可 以 说 ， 它 已 经 是 最 为 复杂 的 一 个 队列 实 
现 。 在 内 部 实现 中 ，LinkedBlockingDeque 使 用 链表 结构 。 每 一 个 队列 
节点 都 维护 一 个 前 驱 结 点 和 一 个 后 驱 节点 。LinkedBlockingDeque 没 有 
进行 读 写 锁 的 分 离 ， 因 此 同一 时 间 只 能 有 一 个 线程 对 其 进行 操作 。 
此 ， 在 高 并 发 应 用 中 ， 它 的 性 能 表现 要 和 远 远 低 于 
LinkedBlockingQueue， 更 要 低 于 ConcurrentLinkedQueue。 

ArrayDeque 继 承 了 Deque (双向 队列 ) 接口 ， 使 用 此 类 可 以 自己 实 
现 java.util.Stack 类 的 功能 ， 去 掉 了 java.util.Stack 的 多 线程 同步 的 功能 。 


java.util.ArrayDeque 的 源码 如 下 所 示 。 


代码 清单 5-75 ArrayDeque 源 代码 
private transient E[] elements; 
private transient int head; 
private transient int tail; 
/* 此 处 存放 e 的 位 置 是 从 elements 数组 最 后 的 位 置 开始 存储 的 */ 
public void addFirst(E e) { 
if (e == null) 


throw new NullPointerException(); 


elements[head = (head - 1) & (elements.length - 1)] = e;// 首 次 数组 容量 默认 


A 16, head= (0-1) &(16-1)=15 
if (head == tail) 
doubleCapacity(); 
} 


/* 每 次 扩容 都 按 插 入 的 先后 顺序 重新 放 入 一 个 新 的 数组 中 ， 最 新 插入 的 放 在 数组 的 第 一 个 位 置 。*/ 


private void doubleCapacity() { 
assert head -- tail; 
int p = head; 
int n = elements.length; 
int r =n - p; // number of elements to the right of p 
int newCapacity =n << 1; 
if (newCapacity « 0) 
throw new IllegalStateException("Sorry, deque too big"); 
Object[] a = new Object[newCapacity]; 
System.arraycopy(elements, p, a, 0, r); 
System.arraycopy(elements, 0, a, r, p); 
elements = (E[])a; 
head = 0; 
tail = n; 
} 
public E removeFirst() { 
E x = pollFirst(); 
if (x == null) 
throw new NoSuchElementException () ; 
return x; 
} 
public E pollFirst() { 
int h = head; 
E result = elements[h]; // Element is null if deque empty 
if (result == null) 
return null; 


elements[h] = null;// 重新 设置 数组 中 的 这 个 位 置 为 null， 方便 垃圾 回收 。 


head = (h + 1) & (elements.length - 1);// 将 head 的 值 回 退 ， 相 当 于 将 栈 的 指针 又 向 下 移 


动 一 格 。 例 如 ，12-- 13 


return result; 


} 
public E peekFirst() { 
return elements[head]; // elements[head] is null if deque empty 


| 


如 果 我 们 希望 创建 一 个 存放 Integer 类 型 的 Stack， 只 要 在 类 中 创建 
一 个 ArrayDeque 类 的 变量 作为 属性 ， 之 后 定义 的 出 栈 、 入 栈 ， 观 察 栈 
顶 元 素 的 操作 就 直接 操作 ArrayDeque 的 实例 变量 即 可 。 


代码 清单 5-76 Integer 类 型 的 Stack 
import java.util.ArrayDeque; 
import java.util.Deque; 
public class IntegerStack { 
private Deque<Integer> data = new ArrayDeque<Integer>() ; 
public void push(Integer element) { 

data.addFirst (element) ; 

} 

public Integer pop() { 
return data.removeFirst(); 

} 

public Integer peek() { 
return data.peekFirst(); 

} 

public String toString() 
return data.toString(); 

} 

public static void main(String[] args) { 

IntegerStack stack = new IntegerStack(); 
for (int i = 0; i < 5; itt) { 

stack.push (i); 
} 

System.out.println (stack); 

System.out.println("After pushing 5 elements: " + stack); 
int m = stack.pop(); 

System.out.println ("Popped element = " + m); 
System.out.println("After popping 1 element : " + stack); 
int n = stack.peek(); 

System.out.println("Peeked element = " + n); 


System.out.println("After peeking 1 element : " + stack); 


(1) ArrayDeque 有 两 个 类 属性 ，head 和 tail， 两 个 指针 。 

(2) ArrayDeque 通 过 一 个 数组 作为 载体 ， 其 中 的 数组 元 素 在 add 等 
方法 执行 时 不 移动 ， 发 生变 化 的 只 是 head 和 tail 指 针 ， 而 且 指 针 是 循环 
变化 ， 数 组 容量 不 限制 |。 

(3) offer 方 法 和 add 方 法 都 是 通过 其 中 的 addLast 方 法 实现 ， 每 添 
加 一 个 元 素 ， 就 把 元 素 加 到 数组 的 尾部 ， 此 时 ，head 指 针 没 有 变化 ， 
而 tail 指 针 加 一 ， 为 措 针 是 循环 加 的 ， 所 以 当 tail 追 上 head 

( (this.tail=this.tail+1&this.elements.length-1) ==this.head) 时 ， 数 组 
容量 翻 一 倍 ， 继 续 执行 。 

(4) remove 方 法 和 poll 方 法 都 是 通过 其 中 的 pollFirst 方 法 实现 ， 每 
移 除 一 个 元 素 ， 该 元 素 所 在 位 置 变 成 null， 此 时 ，tail 指 针 没有 变化 ， 而 
head 指 针 加 一 ， 当 数组 中 没有 数据 时 ， 返 回 null。 

(5) 因为 ArrayDeque 不 是 线程 安全 的 ， 所 以 ， 用 作 堆 栈 时 快 于 
Stack， 在 用 作 队 列 时 快 于 LinkedList。 


5.4.5 并 发 工具 类 


在 JDK 的 开发 包 里 提供 了 几 个 非常 有 用 的 并 发 工具 类 。 
CountDownLatch, CyclicBarrier 和 Semaphore 工 具 类 提供 了 一 种 并 发 流 
程控 制 的 手段 ，CountDownLatch 是 能 使 一 组 线程 等 另 一 组 线程 都 跑 完 
了 再 继续 跑 ; CyclicBarrier 能 够 使 一 组 线程 在 一 个 时 间 点 上 达到 同步 ， 
可 以 是 一 起 开始 执行 全 部 任务 或 者 一 部 分 任务 。 同 时 ， 它 是 可 以 循环 
使 用 的 ; Semaphore 是 只 人 允许 一 定数 量 的 线程 同时 执行 一 部 分 任务 。 
Exchanger 工 具 类 则 提供 了 在 线程 间 交 换 数 据 的 一 种 手段 。 

5.4.5.1 CountDownLatch 工 具 类 

直译 过 来 就 是 倒 计 数 (CountDown) [JH (Latch) 。 倒 计数 不 用 
说 ， 门 六 的 意思 顾名思义 就 是 阻止 前 进 。 在 这 里 就 是 指 
CountDownLatch.await () 方法 在 倒 计 数 为 0 之 前 会 阻塞 当前 线程 。 

CountDownLatch 的 作用 和 Thread.join () 方法 类 似 ， 可 用 于 一 组 线 
程 和 另外 一 组 线程 的 协作 。 例 如 ， 主 线程 在 做 一 项 工作 之 前 需要 一 系 
列 的 准备 工作 ， 只 有 这 些 准备 工作 都 完成 ， 主 线程 才能 继续 它 的 工 
作 。 这 些 准备 工作 彼此 独立 ， 所 以 可 以 并 发 执行 以 提高 速度 。 在 这 个 


景 下 就 可 以 使 用 CountDownLatch 协调 线程 之 间 的 调度 了 。 在 直接 创 
建 线 程 的 年 代 (Java 5.0 之 前 ) ， 我 们 可 以 使 用 Thread.join () o Æ 
JUC 出 现 后 ， 因 为 线程 池 中 的 线程 不 能 直接 被 引用 ， 所 以 就 必须 使 用 
CountDownLatch 了 。 

CountDownLatch 人 允许 一 个 或 多 个 线程 等 待 其 他 线程 完成 操作 。 

假设 有 这 么 一 个 场景 : 我 们 需要 解析 一 个 Excel 里 多 个 Sheet 的 数 
据 ， 此 时 可 以 考虑 使 用 多 线程 ， 每 个 线程 解析 一 个 Sheet 里 的 数据 ， 等 
到 所 有 的 Sheet 都 解析 完 之 后 ， 程 序 需要 提示 解析 完成 。 在 这 个 需 3 
中 ， 要 实现 主线 程 等 待 所 有 线程 完成 Sheet 的 解析 操作 ， 最 简单 的 做 法 
是 使 用 join O 方法 ， 如 以 下 代码 所 示 。 


代码 清单 5-77 join 示例 
public class JoinCountDownLatchTest { 
public static void main(String[] args) throws InterruptedException{ 


Thread parserl = new Thread(new Runnable (){ 


@Override 

public void run() { 

// TODO Auto-generated method stub 
System.out.println("parserl finish!"); 


} 


h); 
Thread parser2 = new Thread(new Runnable (){ 


@Override 
public void run() { 

// TODO Auto-generated method stub 
System.out.println("parser2 finish!"); 


} 
h; 


parserl.start(); 
parser2.start(); 
parserl.join(); 
parser2.join(); 


System.out.println("all parser finish"); 


| 


join O 方法 用 于 让 当前 执行 线程 等 待 join 线程 执行 结束 。 其 实现 
原理 是 不 停 检 查 join 线 程 是 否 存 活 ， 如 果 join 线 程 存活 则 让 当前 线程 永 
远 等 待 。 直 到 join 线 程 中 之 后 ， 线 程 的 this.notifyAll () 方法 会 被 调 
用 ， 调 用 notifyAll () 方法 是 在 JVM 里 实现 的 。 

在 JDK5 之 后 的 并 发 包 中 提供 的 CountDownLatch 也 可 以 实现 join 的 
功能 。 

CountDownLatch 的 构造 水 数 接收 一 个 int 类 型 的 参数 作为 计数 器 ， 
如 果 你 想 等 待 N 个 工作 完成 ， 这 里 就 传 入 N。 当 我 们 调用 
CountDownLatch 的 countDown 方 法 时 ，N 就 会 减 小 1，CountDownLatch 
的 await 方 法 会 阻塞 当前 线程 ， 直 到 N 变 成 零 。 由 于 countDown 方 法 可 以 
用 在 任何 地 方 ， 所 以 这 里 说 的 N 个 点 ， 可 以 是 N 个 线程 ， 也 可 以 是 1 个 


线程 里 的 N 个 执行 步骤 。 用 在 多 个 线程 时 ， 只 需要 把 这 个 
CountDownLatch 的 引用 传递 到 线程 里 即 可 。 

CountDownLatch 类 是 一 个 同步 计数 器 ， 构 造 时 传 入 int 参 数 ， 该 参 
数 就 是 计数 器 的 初始 值 ， 每 调用 一 次 countDown () 方法 ， 计 数 器 减 
1， 计 数 器 大 于 0 时 ，await () 方法 会 阻塞 程序 继续 执行 
CountDownLatch 如 其 所 写 ， 是 一 个 倒 计 数 的 锁 存 器 ， 当 计数 减 至 0 时 触 
发 特定 的 事件 。 利 用 这 种 特性 ， 可 以 让 主线 程 等 待 子 线程 的 结束 。 下 
面 以 一 个 模拟 运动 员 比 赛 的 例子 加 以 说 明 。 


代码 清单 5-78 CountDownLatchDemo 类 代码 


import java.util.concurrent.CountDownLatch; 
import java.util.concurrent.Executor; 
import java.util.concurrent.ExecutorService; 


import java.util.concurrent.Executors; 


public class CountDownLatchDemo { 
private static final int PLAYER AMOUNT - 5; 
public CountDownLatchDemo() { 


// TODO Auto-generated constructor stub 
} 
pre * @param args * 
public static void main(String[] args) { 
// TODO Auto-generated method stub 
// 对 于 每 位 运动 员 ，CountDownLatch 减 1 后 即 结 束 比 赛 
CountDownLatch begin = new CountDownLatch (1); 
// 对 于 整个 比赛 ， 所 有 运动 员 结 束 后 才 算 结 束 
CountDownLatch end = new CountDownLatch (PLAYER AMOUNT); 
Player[] plays - new Player[PLAYER AMOUNT]; 
for(int i=0;i<PLAYER_AMOUNT; i++) 
plays[i] = new Player(i-*1l,begin,end); 
// 设 置 特定 的 线程 池 ， 大 小 为 5 
ExecutorService exe - Executors.newFixedThreadPool (PLAYER AMOUNT); 
for(Player p:plays) { 
exe.execute (p); 
// 分 配 线程 
System.out.println("Race begins!"); 
begin.countDown(); 
try{ 
end.await(); 
/ / Fff end 状态 变 为 0， 即 为 比赛 结束 
}catch (InterruptedException e) { 
// TODO: handle exception 
e.printStackTrace(); 
}finally{ 
System.out.println("Race ends!"); 
} 


exe.shutdown(); 


代码 清单 5-79 Player 类 代码 


import java.util.concurrent.CountDownLatch; 


public class Player implements Runnable { 

private int id; 

private CountDownLatch begin; 

private CountDownLatch end; 

public Player(int i, CountDownLatch begin, CountDownLatch end) { 
// TODO Auto-generated constructor stub 
super(); 
this.id = i; 
this.begin - begin; 
this.end = end; 

} 


@Override 


public void run() ( 

// TODO Auto-generated method stub 

try{ 
begin.await (); 
/ [5 begin 的 状态 为 0 
Thread.sleep ( (long) (Math.random()*100)); 
// 随 机 分 配 时 间 ， 即 运动 员 完成 时 间 
System.out.println("Play"4id*" arrived."); 

}catch (InterruptedException e) ( 
// TODO: handle exception 
e.printStackTrace(); 

}finally{ 
end.countDown () ; 
/ [f end RSM 1, RARE 0 


} 


BAN Kit, — A if a LS 4 CountDownLatch L BA, 
CountDownlatch 是 一 种 Sychronizer， 它 可 以 延迟 线程 的 进度 直到 线程 的 
进度 到 线程 到 达 终 止 状态 。 

5.4.5.2 CyclicBarrier 工 具 类 

CyclicBarrier 翻译 过 来 叫 循环 栅栏 、 循 环 障碍 。 它 主要 的 方法 就 是 
一 个 : await () o await () 方法 每 被 调用 一 次 ， 计 数 便 会 减少 1， 并 阻 
塞 住 当 前 线程 。 当 计数 减 至 0 时 ， 阻 塞 解 除 ， 所 有 在 此 CyclicBarrier 上 
面 阻塞 的 线程 开始 运行 。 在 这 之 后 ， 如 果 再 次 调用 await () 方法 ， 计 
数 就 又 会 变 成 N-1， 新 一 轮 重 新 开始 ， 这 便 是 Cydlic 的 含义 所 在 。 

CyclicBarrier 的 使 用 并 不 难 ， 但 需要 注意 它 所 相关 的 异常 。 除 了 常 
见 的 异常 ，CyclicBarrierawait () 方法 会 抛 出 一 个 独 有 的 
BrokenBarrierException o. 这 个 异常 发 生 在 当 某 个 线程 在 等 待 本 
CyclicBarrier 时 被 中 断 或 超时 或 被 重 置 时 ， 其 他 同样 在 这 个 
CyclicBarrier 上 等 待 的 线程 便 会 受到 BrokenBarrierException。 意思 就 是 


说 ， 同 志 们 ， 别 等 了 ， 有 个 小 伙伴 已 经 挂 了 ， 咱 们 如 果 继 续 等 有 可 能 
会 一 直 等 下 去 ， 所 以 各 回 各 家 吧 。 

CyclicBarrier.await () 方法 带 有 返回 值 ， 用 来 表示 当前 线程 是 第 几 
个 到 达 这 个 Barrier 的 线程 。 

和 CountDownLatch 一 样 ，CyclicBarrier 同 样 可 以 可 以 在 构造 轴 数 中 
设 定 总 计数 值 。 与 CountDownLatch 不 同 的 是 ，CyclicBarrier 的 构造 函数 
还 可 以 接受 一 个 Runnable， 会 在 CyclicBarrier 被 释放 时 执行 。 

CyclicBarrier 工 具 类 人 允许 一 组 线程 互相 等 待 ， 直 到 达到 某 个 公共 屏 
障 点 (common barrier point) 。 在 涉及 一 组 固定 大 小 的 线程 的 程序 中 ， 
这 些 线程 必须 不 时 地 互相 等 待 ， 此 时 CyclicBarrier 很 有 和 用。 因为 该 
barrier 在 释放 等 待 线 程 后 可 以 重用 ， 所 以 称 它 为 循环 的 barrier。 
CyclicBarrier 支 持 一 个 可 选 的 Runnable 命 令 ， 在 一 组 线程 中 的 最 后 一 个 
线程 到 达 之 后 (但 在 释放 所 有 线程 之 前 ) ， 该 命令 只 在 每 个 屏障 点 运 
行 一 次 。 若 在 继续 所 有 参与 线程 之 前 更 新 共享 状态 ， 此 屏障 操作 很 有 
用 。 

在 某 种 需求 中 ， 比 如 一 个 大 型 的 任务 ， 常 常 需要 分 配 好 多 子 任务 
去 执行 ， 只 有 当 所 有 子 任务 都 执行 完成 时 候 ， 才 能 执行 主任 务 ， 这 时 
候 就 可 以 选择 CyclicBarrier 了 。 

常用 的 方法 是 await 方 法 ， 

public int await()throws InterruptedException, BrokenBarrierException 

在 所 有 参与 者 都 已 经 在 此 barrier 上 调用 await 方 法 之 前 ， 将 一 直 等 
待 。 如 果 当 前 线程 不 是 将 到 达 的 最 后 一 个 线程 ， 出 于 调度 目的 ， 将 禁 
用 它 ， 且 在 发 生 以 下 情况 之 一 前 ， 该 线程 将 一 直 处 于 休眠 状态 。 

m 最 后 一 个 线程 到 达 ; 或 者 

m 其 他 某 个 线程 中 断 当 前 线程 ; 或 者 

m 其 他 某 个 线程 中 断 另 一 个 等 待 线程 ; 或 者 

m 其 他 某 个 线程 在 等 待 barrier 时 超时 ; 或 者 

m 其 他 某 个 线程 在 此 barrier 上 调用 reset () 。 

如 果 当 前 线程 : 

e 在 进入 此 方法 时 已 经 设置 了 该 线程 的 中 断 状 态 ; 或 者 


m 在 等 待 时 被 中 断 。 

则 抛 出 InterruptedException， 并 且 清 除 当 前 线程 的 已 中 断 状态 。 如 
果 在 线程 处 于 等 待 状态 时 barrier 被 reset () ， 或 者 在 调用 await 时 barrier 
被 损坏 ， 抑 或 任意 一 个 线程 正 处 于 等 待 状态 ， 则 抛 出 
BrokenBarrierException 异 常 。 

如 果 任 何 线程 在 等 待 时 被 中 断 ， 则 其 他 所 有 等 待 线 程 都 将 抛 出 
BrokenBarrierException 异 常 ， 并 将 barrier 置 于 损坏 状态 。 

如 果 当 前 线程 是 最 后 一 个 将 要 到 达 的 线程 ， 并 且 构 造 方法 中 提供 
了 一 个 非 空 的 屏障 操作 ， 则 在 允许 其 他 线程 继续 运行 之 前 ， 当 前 线程 
将 运行 该 操作 。 如 果 在 执行 屏障 操作 过 程 中 发 生 异 常 ， 则 该 异常 将 传 
播 到 当前 线程 中 ， 并 将 barrier 置 于 损坏 状态 。 

返回 : 

到 达 的 当前 线程 索引 ， 其 中 ， 索 引 getParties () -1 指示 将 到 达 的 第 
一 个 线程 ， 零 指示 最 后 一 个 到 达 的 线程 。 

Tdi: 

InterruptedException: 如 果 当 前 线程 在 等 待 时 被 中 断 

BrokenBarrierException: 如 果 另 一 个 线程 在 当前 线程 等 待 时 被 中 断 
或 超时 ， 或 者 重 置 了 barrier， 或 者 在 调用 await 时 barrier 被 损坏 ， 抑 或 由 
于 异常 而 导致 屏障 操作 (如 果 存 在 ) AM 

示例 代码 如 下 所 示 。 


代码 清单 5-80 CyclicBarrierDemo 
import java.io.IOException; 
import java.util.Random; 
import java.util.concurrent.BrokenBarrierException; 


import java.util.concurrent.CyclicBarrier; 


import java.util.concurrent.ExecutorService; 


import java.util.concurrent.Executors; 


public class CyclicBarrierDemo { 
public static void main(String[] args) throws IOException, InterruptedException ( 


// 如 果 将 参数 改 为 4， 但 是 下 面 只 加 入 了 3 个 选手 ， 这 永远 等 待 下 去 

//Waits until all parties have invoked await on this barrier. 
CyclicBarrier barrier = new CyclicBarrier(3); 

ExecutorService executor = Executors.newFixedThreadPool (3); 
executor.submit(new Thread(new Runner (barrier, "1 号 选手 ") ) ) ; 
executor.submit (new Thread (new Runner (barrier, "2 号 选手 ") ) ) ; 
executor.submit (new Thread (new Runner (barrier, "3 号 选手 ") ) ) ; 


executor.shutdown(); 


class Runner implements Runnable { 
// 一 个 同步 辅助 类 , 它 允许 一 组 线程 互相 等 待 ,直到 到 达 某 个 公共 屏障 点 (commonbarrierpoint) 19. 


private CyclicBarrier barrier; 


private String name; 


public Runner (CyclicBarrier barrier, String name) { 


} 


super (); 
this.barrier = barrier; 


this.name - name; 


@Override 


public void run() { 


将 一 直 等 待 . 


try { 
Thread.sleep(1000 * (new Random()).nextInt (8)); 
System.out.println(name + " 准备 好 了 .,.."); 


// barrier 4 await 方法 ,在 所 有 参与 者 都 已 经 在 此 barrier 上 调用 await 方法 之 前 ， 


barrier.await(); 

) catch (InterruptedException e) { 
e.printStackTrace(); 

) catch (BrokenBarrierException e) { 
e.printStackTrace(); 

} 

System.out .println (name + " 起 跑 ! "); 


运行 输出 如 代码 清单 5-81 所 示 。 


代码 清单 581 CyclicBarrierDemo 
1 号 选手 准备 好 了 ,, ， 
3 号 选手 准备 好 了 ,, ， 
2 号 选手 准备 好 了 ，,， 
2 号 选手 起 跑 | 
1 号 选手 起 跑 ! 
3 号 选手 起 跑 | 
除了 前 面 介绍 的 await 方 法 以 外 ， 还 有 以 下 方法 。 
await () : 在 所 有 参与 者 都 已 经 在 此 barrier 上 调用 await 方 法 之 
前 ， 将 一 直 等 待 。 
await (long timeout，TimeUnit unit) : 在 所 有 参与 者 都 已 经 在 此 
屏障 上 调用 await 方 法 之 前 ， 将 一 直 等 待 。 
getNumberWaiting () : 返回 当前 在 屏障 处 等 待 的 参与 者 数目 。 
getParties () : 返回 要 求 启动 此 barrier 的 参与 者 数目 。 
isBroken () : 查询 此 屏障 是 否 处 于 损坏 状态 。 
reset () : 将 屏障 重 置 为 其 初始 状态 。 
如 果 在 构造 CyclicBarrier 对 象 的 时 候 传 了 一 个 Runnable 对 象 进去 ， 
则 每 次 到 达 公 共 屏 障 点 的 时 候 都 最 先 执行 这 个 传 进去 的 Runnable， 然 后 
再 执行 处 于 等 待 的 Runnable。 


代码 清单 5-82 CyclicBarrierDemo' 


import java.util.concurrent.CyclicBarrier; 
import java.util.concurrent.ExecutorService; 


import java.util.concurrent.Executors; 


public class CyclicBarrierDemol { 
public static void main(String[] args) { 
ExecutorService service = Executors.newCachedThreadPool () ; 
//final CyclicBarrier cb = new CyclicBarrier (3); //4]i£ CyclicBarrier 对 象 并 
设置 3 个 公共 屏障 点 

final CyclicBarrier cb = new CyclicBarrier(3,new Runnable(){ 
@Override 
public void run() { 

System. out.println ("** tee R RE peeeeeeeeeeem] ; 
} 
D); 
for(int i=0;i<3;i++){ 

Runnable runnable = new Runnable() { 

public void run() { 
try { 
Thread. sleep ( (long) (Math. random()*10000) ) ; 


System,out ,println(" 线 程 " + Thread. currentThread() .getName () 


"即将 到 达 集 合 地 点 1， 当 前 已 有 " + cb.getNumberWaiting() + "个 已 
Zak, EEFE"); 
ch.await () ;1/ 到 此 如 果 没 有 达到 公共 屏障 点 ， 则 该 线程 处 于 等 待 状态 ， 如 果 
达到 公共 屏障 点 则 所 有 处 于 等 待 的 线程 都 继续 往 下 运行 


Thread.sleep( (long) (Math.random()*10000)); 
System.out.println(" Ae" t Thread.currentThread().getName() * 
"即将 到 达 集合 地 点 2， 当 前 已 有 " + cb.getNumberWaiting() + "^E 
经 到 达 ， 正 在 等 候 ") ; 
cb.await(); ”// 这 里 CyclicBarrier 对 象 又 可 以 重用 
Thread.sleep( (long) (Math. random()*10000)); 
System,out ,println ("线程 " + Thread.currentThread().getName() + 
"即将 到 达 集 合 地 点 3， 当 前 已 有 " + ch.getNumberWaiting() + "个 已 
经 到 达 ， 正 在 等 修 ") ; 
ch.await(); 
} catch (Exception e) { 


e.printStackTrace(); 


hi 
service.execute (runnable); 


| 


service.shutdown(); 


| 


运行 输出 如 代码 清单 5-83 所 示 。 


代码 清单 5-83 CydicBarrierDemot 
线程 poo1-1-thread-1 即将 到 达 集合 地 点 1， 当 前 已 有 0 个 已 经 到 达 ， 正 在 等 候 
线程 poo1-1-thread-3 即将 到 达 集合 地 点 1， 当 前 已 有 1 个 已 经 到 达 ， 正 在 等 修 
线程 po01-1-thread-2 即将 到 达 集合 地 点 1， 当 前 已 有 2 个 已 经 到 达 ， 正 在 等 候 
EOI a EDU tit 
线程 po01-1-thread-2 即将 到 达 集合 地 点 2， 当 前 已 有 0 个 已 经 到 达 ， 正 在 等 全 
线程 po01-1-thread-1 即将 到 达 集合 地 点 2， 当 前 已 有 1 个 已 经 到 达 ， 正 在 等 候 
Afi pool-1-thread-3 即将 到 达 集合 地 点 2， 当 前 已 有 2 个 已 经 到 达 ， 正 在 等 修 
KAAKAA AA f SUE Ju peeeeeneeon 
Aft pool-1-thread-1 即将 到 达 集合 地 点 3， 当 前 已 有 0 个 已 经 到 达 ， 正 在 等 候 
线程 po01-1-thread-2 即将 到 达 集合 地 点 3， 当 前 已 有 1 个 已 经 到 达 ， 正 在 等 修 
Af pool-1-thread-3 即将 到 达 集合 地 点 3， 当 前 已 有 2 个 已 经 到 达 ， 正 在 等 修 
Xk 六 我 最 先 执行 * 


CyclicBarrier 的 功能 也 可 以 由 CountDownLatch 来 实现 。 但 是 两 者 是 
有 一 些 区 别 的 ，CountDownLatch 适 用 于 一 组 线程 和 另 一 个 主线 程 之 间 
的 工作 协作 。 一 个 主线 程 等 待 一 组 工作 线程 的 任务 完毕 才 继 续 它 的 执 
行 是 使 用 CountDownLatch 的 主要 场景 ; CyclicBarrier 用 于 一 组 或 几 组 绪 
程 ， 比 如 一 组 线程 需要 在 一 个 时 间 点 上 达成 一 致 ， 例 如 同时 开始 一 个 
工作 。 另 外 ，CyclicBarrier 的 循环 特性 和 构造 永 数 所 接受 的 Runnable 参 
数 也 是 CountDownLatch 所 不 具备 的 。 

5.4.5.3 Semaphore 工 具 类 

直译 是 信号 量 ， 可 能 称 它 是 许可 量 更 容易 理解 。 当 然 ， 因 为 在 计 
算 机 科学 中 这 个 名 字 由 来 已 久 ， 所 以 不 能 乱 改 。 它 的 功能 比较 好 理 
解 ， 就 是 通过 构造 函数 设 定 一 个 数量 的 许可 ， 然 后 通过 acquire 方 法 获 
得 许可 , release 75 AK E X YF Hl. CR & tryAcquire 和 
acquireUninterruptibly 方 法 ， 可 以 根据 自己 的 需要 选择 。 

public void acquire () throws InterruptedException 从 此 信号 量 获取 
一 个 许可 ， 在 提供 一 个 许可 前 一 直 将 线程 阻塞 ， 人 否则 线程 被 中 断 。 获 
取 一 个 许可 (如 果 提 供 了 一 个 ) 并 立即 返回 ， 将 可 用 的 许可 数 减 1。 


如 果 没 有 可 用 的 许可 ， 则 在 发 生 以 下 两 种 任意 情况 前 ， 禁 止 将 当 
前 线程 用 于 线程 安排 目的 并 使 其 处 于 休眠 状态 。 

m 某 些 其 他 线程 调用 此 信号 量 的 release () 方法 ， 并 且 当 前 线程 
是 下 一 个 要 被 分 配 许可 的 线程 。 

m 其 他 某 些 线程 中 断 当 前 线程 。 

如 果 当 前 线程 : 

m 被 此 方法 将 其 已 中 断 状 态 设置 为 on。 

自在 等 待 许可 时 被 中 断 。 

则 抛 出 InterruptedException， 并 且 清 除 当 前 线程 的 已 中 断 状 态 。 

抛 出 : InterruptedException- 如 果 当 前 线程 被 中 断 。 

public void release () 方法 : 释放 一 个 许可 ， 将 其 返回 给 信号 量 。 
释放 一 个 许可 ， 将 可 用 的 许可 数 增加 1。 如 果 任 意 线程 试图 获取 许可 ， 
则 选中 一 个 线程 并 将 刚刚 释放 的 许可 给 予 它 。 然 后 针对 线程 安排 目的 
启用 (或 再 启用 ) 该 线程 。 不 要 求 释 放 许 可 的 线程 必须 通过 调用 
acquire () 来 获取 许可 。 通 过 应 用 程序 中 的 编程 约定 来 建立 信号 量 的 
正确 用 法 。 


代码 清单 584 SemaphoreDemo 


import java.util.concurrent.ExecutorService; 
import java.util.concurrent.Executors; 


import java.util.concurrent.Semaphore; 


public class SemaphoreDemo { 
public static void main(String[] args) { 

// 线程 池 
ExecutorService exec = Executors.newCachedThreadPool (); 
// 只 能 5 个 线程 同时 访问 
final Semaphore semp = new Semaphore (5); 
// 模拟 20 个 客户 端 访问 
for (int index = 0; index < 20; index++) { 


final int NO = index; 
Runnable run = new Runnable() { 
public void run() { 
try { 

// 获取 许可 
semp.acquire(); 
System.out.println("Accessing: " + NO); 
Thread.sleep((long) (Math.random() * 10000)); 


// GARE, 释放， 如 果 屏 蔽 下 面 的 语 自 ， 则 在 控制 台 只 能 打印 5 条 记录 ， 
之 后 线程 一 直 阻 塞 
semp.release(); 
} catch (InterruptedException e) ( 
} 


H 
exec.execute (run); 


} 
// 退出 线程 池 
exec.shutdown () ; 


} 


运行 输出 如 清单 5-85 所 示 。 


代码 清单 585 SemaphoreDemo 


Accessing: 


Accessing: 


0 

2 
Accessing: 4 
Accessing: 1 
Accessing: 6 
Accessing: 8 
Accessing: 10 
Accessing: 12 
Accessing: 17 
Accessing: 3 
Accessing: 5 


Accessing: 7 


上 面 的 例子 只 允许 5 个 线程 同时 进入 执行 acquire () 和 release () 
之 间 的 代码 。 


5.4.5.4 Exchanger 工 具 类 

Exchanger 可 以 在 两 个 线程 之 间 交 换 数据 ， 只 能 是 2 个 线程 ， 他 不 支 
持 更 多 的 线程 之 间 互 换 数据 。 

当 线 程 A 调 用 Exchange 对 象 的 exchange ( 方法 后 ， 他 会 陷入 阻塞 
状态 ， 直 到 线程 B 也 调用 了 exchange O 方法 ， 然 后 以 线程 安全 的 方式 
交换 数据 ， 之 后 线程 A 和 B 继 续 运行 。 


代码 清单 5-86 ThreadLocalDemo 
import java.util.ArrayList; 
import java.util.List; 
import java.util.Random; 


import java.util.concurrent.Exchanger; 


public class ThreadLocalDemo { 


public static void main(String[] args) { 


Exchanger<List<Integer>> exchanger = new Exchanger«List«Integer»»(); 
new Consumer (exchanger) .start(); 


new Producer (exchanger) .start(); 


class Producer extends Thread { 
List«Integer» list = new ArrayList<Integer>(); 
Exchanger<List<Integer>> exchanger = null; 
public Producer (Exchanger<List<Integer>> exchanger) { 
super (); 
this.exchanger = exchanger; 
} 
@Override 
public void run() { 
Random rand = new Random() ; 
for(int i=0; i«10; i++) { 
list.clear(); 
list.add(rand.nextInt (10000) ); 
list.add(rand.nextInt (10000) ); 
list.add(rand.nextInt (10000) ); 
list.add(rand.nextInt (10000) ); 
list.add(rand.nextInt (10000) ); 
try { 
list = exchanger .exchange (list); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 
e.printStackTrace(); 


class Consumer extends Thread ( 
List«Integer» list = new ArrayList<Integer>(); 
Exchanger<List<Integer>> exchanger = null; 
public Consumer(Exchanger«List«Integer»» exchanger) ( 
super(); 
this.exchanger - exchanger; 
) 
@Override 
public void run() { 
for(int i=0; i«10; i++) { 
try { 
list = exchanger .exchange (list); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


System.out.print (list.get 


( ( 
System.out.print (list.get ( 
System. out.print (list.get(2)+", " 

( 


System.out.print (list.get 


System.out.println(list.get(4)*", "); 


运行 输出 如 清单 5-87 所 示 。 


代码 清单 5-87 ThreadLocalDemo 
6825, 4001, 7074, 7624, 6241, 
4657, 1334, 3052, 1267, 4737, 
4208, 3299, 2163, 8197, 2683, 
4207, 141, 5700, 1485, 771, 
6906, 5448, 2633, 563, 7218, 
433, 5361, 8148, 9710, 1737, 
267, 2610, 8424, 9874, 4910, 
5185, 7682, 2220, 7114, 7467, 
7823, 2242, 7842, 551, 626, 
2356, 9511, 4107, 7537, 688, 


5.5 本 章 小 结 


本 章 首 先 针对 并 行程 序 优化 的 一 些 普 遍 型 概念 、 技 巧 进行 了 介 
绍 ， 包 括 进程 、 线 程 方面 的 概念 性 知识 ， 也 对 Synchronized、 Volatile, 
锁 、 绪 程 池 等 很 实用 的 使 用 技巧 进行 了 总 结 ， 接 下 来 对 增强 程序 并 行 
能 力 的 几 个 技巧 进行 了 前 述 ， 最 后 针对 JDK 自 带 的 一 些 类 库 ， 例 如 并 行 


容器 、 队 列 、 工 具 类 等 进行 了 解释 ， 特 别 是 对 这 些 类 库 的 使 用 进行 了 
详细 的 描述 。 


[1] Mesos 是 集群 管理 器 ， 力 争 通过 在 多 种 框架 之 间 动 态 共享 资源 来 优化 资源 使 用 率 。 该 项 目 于 2009 年 由 位 于 Berkeley 的 加 
利 福 尼 亚 大 学 发 起 ， 已 经 在 很 多 公司 的 生产 环境 上 使 用 过 ， 包 括 Twitter 和 Airbnb。2013 年 7 月 ， 在 该 项 目 孵化 大 概 两 年 
时 ， 就 成 为 Apache 的 最 高 级 别 项 目 。 


[2] 同时 也 是 互 斥 锁 ， 即 一 次 最 多 只 能 有 一 个 线程 持 有 的 锁 ， 在 jdk1.5 之 前 ， 我 们 通常 使 用 synchronized 机 制 控制 多 个 线程 
对 共享 资源 的 访问 。 

[3] TLB (Translation Lookaside Buffer) 传输 后 备 缓冲 器 是 一 个 内 存 管 理 单元 用 于 改进 虚拟 地 址 到 物理 地 址 转换 速度 的 
缓存 。 

[4] 流水 线 是 Intel 首 次 在 486 芯 片 中 开始 使 用 的 。 流 水 线 的 工作 方式 就 象 工 业 生产 上 的 装配 流水 线 。 在 CPU 中 由 5 到 6 个 不 同 
功能 的 电路 单元 组 成 一 条 指令 处 理 流水 线 ， 然 后 将 一 条 X86 指令 分 成 5 到 6 步 后 再 由 这 些 电路 单元 分 别 执行 ， 这 样 就 能 实现 
在 一 个 CPU 时 钟 周期 完成 一 条 指令 ， 因 此 提高 CPU 的 运算 速度 。 

[5] 该 算法 在 Michael&Scott 算 法 上 进行 了 一 些 修改 。 


[6] 来 源 于 William Scherer, Doug Lea, and Michael Scott 编 写 的 论文 : http: //www.cs.rice.edu/~wns1/papers/2006- 
PPoPP-SQ.pdf 


第 6 章 JVM 性 能 测试 及 监控 


《三 国志 : 魏 志 : 华 化 传 》: 府 吏 倪 寻 、 李 延 共 止 ， 俱 头痛 身 热 ， 所 
苦 正 同 。 伦 日 :“ 寻 当下 之 ， 延 当 发 汗 。? 或 难 其 异 ， 伦 日 :“ 寻 外 实 ， 
延 内 实 ， 故 治之 宜 殊 。” 即 各 与 药 ， 明 旦 并 起 。 

Java 程 序 设计 优化 不 可 避免 地 需要 与 JVM 打 交道 ， 在 提出 优化 方案 
之 前 ， 我 们 可 以 有 效 地 利用 JVM 自 带 检测 方式 、 各 种 开源 工具 来 帮助 
我 们 找 出 性 能 瓶颈 ， 最 终 帮 助 我 们 对 症 下 药 。 

总 的 来 说， 改善 性 能 需要 3 个 步骤 ， 即 性 能 监控 、 性 能 分 析 、 人 性 能 
调 优 。 

性 能 监控 : 一 种 以 非 强行 或 者 入 侵 方式 收集 或 查看 应 用 运营 性 能 
数据 的 活动 。 监 控 通 常 是 指 一 种 在 生产 、 质 量 评估 或 者 开发 环境 下 实 
施 的 带 有 预防 或 主动 性 的 活动 。 当 应 用 相关 干系 人 提出 性 能 问题 却 没 
有 提供 足够 多 的 线索 时 ， 首 先 我 们 需要 进行 性 能 监控 ， 随 后 是 性 能 分 
析 。 

性 能 分 析 : 一 种 以 侵入 方式 收集 运行 性 能 数据 的 活动 ， 它 会 影响 
应 用 的 吞吐 量 或 响应 性 。 性 能 分 析 是 针对 性 能 问题 的 答复 结果 ， 关 注 
的 范围 通常 比 性 能 监控 更 加 集中 。 性 能 分 析 很 少 在 生产 环境 下 进行 ， 
通常 是 在 质量 评估 、 系 统 测 试 或 者 开发 环境 下 进行 ， 是 性 能 监控 之 后 
的 步骤 。 

性 能 调 优 : 一 种 为 改善 应 用 响应 性 或 吞吐 量 而 更 改 参 数 、 源 代 
码 、 属 性 配置 的 活动 ， 性 能 调 优 是 在 性 能 监控 、 性 能 分 析 之 后 的 活 
动 。 

通过 以 上 三 步 又， 我 们 可 以 定位 、 为 解决 问题 找到 依据 ， 本 章 解 
决 的 是 前 两 个 步 又 ， 第 3、4、5、7、8 章 解决 第 三 个 步骤 。 

本 章 主 要 介绍 和 解决 以 下 问题 ， 这 也 是 下 一 章节 的 预备 知识 : 

m 如 何 监控 计算 机 设备 。 

m 如 何 监控 应 用 程序 。 

m 如 何 监 控 JVM。 


6.1 监控 计算 机 设备 层 


系统 的 整体 性 能 由 许多 因素 决定 ， 例 如 CPU 利用 率 、CPU 队 列 长 
度 、 磁 盘 空间 和 IO、 内存 使 用 情况 、 网 络 流量 等 。 对 于 实时 性 要 求 较 
高 的 系统 而 言 ， 对 系统 关键 性 指标 的 有 效 监控 和 有 效 管理 是 保证 系统 
高 可 用 性 的 重要 手段 ， 因 此 ， 务 必 和 制定 出 明确 的 系统 性 能 策略 规划 ， 
并 对 这 些 性 能 指标 进行 有 效 的 实时 监控 。 如 果 关 键 性 能 指标 严重 偏离 
或 者 系统 发 生 故 障 ， 应 该 采取 有 效 手 段 来 准确 定位 问题 引发 的 原因 ， 
并 通过 调 优 系统 配置 或 改进 应 用 程序 等 手段 来 有 效 提高 系统 的 可 用 
性 。 

为 了 监控 设备 层 各 个 子 章节 里 面 介绍 的 工具 或 者 程序 能 够 在 同一 
个 测试 样本 上 进行 测试 及 现象 描述 ， 我 们 这 里 编写 一 个 简单 的 应 用 程 
序 ， 该 程序 会 启动 若干 线程 ， 每 个 线程 会 动态 调整 对 于 CPU、 内 存 、 
磁盘 、 网 络 、 操 作 系统 内 部 锁 等 的 占用 情况 ， 通 过 程序 帮助 我 们 在 同 
一 维度 了 解 各 个 工具 或 者 程序 的 使 用 方式 及 优 缺 点 。 


代码 清单 6-{ 应 用 程序 代码 
import java.io.File; 
import java.io.FileInputStream; 
import java.io.FileNotFoundException; 
import java.io.FileOutputStream; 
import java.io.IOException; 


import java.util.Random; 


import java.util.Vector; 


public class demoCode { 
public static class HoldCPUTask implements Runnable{ 
public static Object[] lock = new Object[100]; 
public static Random r = new Random(); 
static( 
for(int i=0;i<lock.length; i++) { 
lock[i] = new Object (); 


@Override 
public void run() { 
int loop=0; 


// TODO Auto-generated method stub 
while (true) { 
// 随 机 占用 CPU 资源 
int loopNume (int) (Math.random()*100);//P &—^* 1-100 的 随机 数 ， 该 数值 
被 用 来 确定 冒 泡 算法 基础 数据 个 数 
int a[] = new int[loopNum]; 
for(int 1=0;1<loopNum; itt) { 
ali] = (int) (Math. random()*100) ;// 随 机 赋值 


// 开 始 冒 泡 方式 排序 
for(int i=1;i<loopNum; i++) 
{ 
for(int j=0;j<loopNum-i; j++) 
{ 
if (a[j]>a[j+1])// 比 较 交 换 相 邻 元 素 
{ 
int temp; 
temp=a[j]; 
a[j]-a[j*1]; 
a[j*1]-temp; 


// 随 机 占用 磁盘 1/0 
int fileloop=(int) (Math.random()*10000);// 产 生 一 个 1-10000 的 随机 数 ， 
该 数值 被 用 来 确定 写 入 文件 的 次 数 
try{ 
FileOutputStream fos = new FileOutputStream(new File("temp")); 
for(int i=0;i<fileloop;i++) { 
fos.write(i); 
} 
fos.close(); 
FileInputStream fis = new FileInputStream(new File("temp") ); 
while (fis.read() !=-1); 
}catch (FileNotFoundException e) { 
e.printStackTrace(); 
}catch (IOException e) { 
e.printStackTrace(); 


// 随 机 开始 持 有 锁 
int x= (int) (Math.random()*100);// 产 生 一 个 1-100 的 随机 数 ， 该 数值 被 用 来 确 
定 锁 数 量 
synchronized (lock[x]) { 
if (x%2==0) { 
try { 
lock[x] .wait (r.nextInt (10) ); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 
e.printStackTrace(); 
}// 等 待 
}else{ 
lock[x].notifyAll();//i&4m 


// 随 机 开始 占用 内 存 
int memSize- (int) (Math.random()*100);//P &—^* 1-100 的 随机 数 ， 该 数值 
被 用 来 确定 写 入 申请 内 存 大 小 
Vector v = new Vector () 
for(int i=0;i<=10;i++){ 
byte[] b = new byte{memSize*memSize] ; 
v.add (b) ; 


try { 
Thread. sleep (1000) ;// 该 线程 休息 一 会 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 


e.printStackTrace () ; 


public static void main(String[] args) { 
int threadNum- (int) (Math. random () *100) ; // P E-A 1-100 的 随机 数 ， 该 数值 被 用 来 
确定 工作 线程 数量 
System.out.println(threadNum); 
for(int i-0;i«threadNum; i++) { 
new Thread(new HoldCPUTask()).start(); 


6.1.1 监控 CPU 


如 果 我 们 想 要 让 应 用 程序 的 性 能 或 者 程序 的 扩展 性 达到 最 高 ， 必 
须 充 分 利用 分 配给 它 的 CPU 周期 [1]。 我 们 要 解决 如 何在 多 处 理 器 、 多 
核 、 异 构 型 态 服务 器 [2] 上 运行 的 多 线程 应 用 ， 以 便 有 效 利 用 CPU 周 
期 。 此 外 ， 要 特别 注意 的 是 ， 应 用 程序 消耗 很 多 CPU 资源 并 不 意味 着 
性 能 或 者 扩展 性 这 两 个 层面 达到 了 最 高 峰值 。 要 想 找 出 应 用 程序 如 何 
使 用 CPU 周 期 ， 可 以 在 操作 系统 上 监控 CPU 使 用 率 。 

大 多 数 操作 系统 的 CPU 使 用 率 分 为 用 户 态 CPU 使 用 率 和 系统 态 
CPU 使 用 率 两 类 。 用 户 态 CPU 使 用 率 是 指 执行 应 用 程序 代码 的 时 间 占 
总 CPU 时 间 的 百分比 。 系 统 态 CPU 使 用 率 高 意味 着 共享 资源 存在 竞争 
或 者 WO 设备 之 间 存 在 大 量 的 交互 。 既 然 原本 用 于 执行 操作 系统 内 核 调 
用 的 CPU 周 期 也 可 以 用 来 执行 应 用 程序 ， 所 以 理想 情况 下 ， 应 用 程序 
达到 最 高 性 能 和 扩展 性 时 ， 它 的 系统 态 CPU 使 用 率 应 该 为 0%。 虽 然 这 
是 理论 值 ， 但 是 提高 应 用 性 能 和 扩展 性 的 目标 时 我 们 可 以 指定 为 尽 可 
能 降低 系统 态 CPU 的 使 用 率 。 

对 于 计算 密集 型 应 用 程序 来 说 ， 不 仅 要 监控 用 户 态 和 系统 态 CPU 
使 用 率 ， 还 需要 进一步 监控 每 时 钟 指令 数 (Instructions Per Clock, 
IPC) 或 每 指令 时 钟 周 期 (Cycles Per Instruction, CPI) 等 指标 。 这 两 
个 指标 对 于 计算 密集 型 应 用 来 说 很 重要 ， 因 为 现代 操作 系统 自 带 的 
CPU 使 用 率 监控 工具 只 能 报告 CPU 使 用 率 ， 而 没有 CPU 执行 指令 占用 
CPU 时 钟 周 期 的 百分比 。 这 意味 着 ， 即 便 CPU 在 等 待 内 存 中 的 数据 ， 
操作 系统 工具 仍然 会 报告 CPU 繁忙 。 我 们 把 这 种 情况 被 称 为 停滞 ， 当 
CPU 执行 指令 而 所 用 的 操作 数据 不 在 寄存 器 或 者 缓存 中 时 ， 就 会 发 生 
停滞 。 由 于 指令 执行 前 必须 等 待 数 据 从 内 存 被 装 入 CPU 寄存 器 ， 所 以 
一 旦 发 生 人 停滞， 就 会 浪费 时 钟 周 期 。CPU 停 滞 通 常会 等 待 好 几 百 个 时 
钟 周期 。 因 此 提高 计算 密集 型 应 用 性 能 的 策略 就 是 减少 停滞 或 者 改善 
CPU 高 速 缓 存 使 用 率 ， 从 而 减少 CPU 在 等 待 内 存 数据 时 浪费 的 时 钟 周 
期 。 

执行 路 径 长 度 与 CPI 之 间 有 微妙 的 差别 ， 执 行路 径 长 度 与 应 用 程序 
的 算法 选择 关系 密切 ， 而 CPI 与 编译 器 生成 更 有 效 地 代码 有 关 。 前 者 着 
眼 于 通过 选择 合理 的 算法 生成 最 短 的 CPU 指令 序列 ， 后 者 着 眼 于 让 编 
译 器 生成 最 高 效 的 代码 ， 减 少 每 条 CPU 指令 上 消耗 的 CPU 时 钟 周期 
数 。 我 们 假设 一 个 场景 ， 这 样 比较 有 利于 说 明 两 者 的 实际 情况 。 假 设 
执行 某 CPU 指 令 ( 载 入 数据 操作 ) 导致 了 CPU 高 速 缓存 未 命中 。 由 于 


CPU 高 速 缓存 未 命中 ，CPU 需 要 从 内 存 ， 而 不 是 缓存 ， 读 取 这 些 数 
据 ， 最 终 完 成 该 指令 可 能 要 消耗 数 百 个 CPU 时 钟 周期 。 如 果 在 编译 器 
生成 的 指令 序列 之 前 插入 预先 获取 指令 ， 提 前 将 载 入 操作 要 访问 的 数 
据 从 内 存 读 取 到 缓存 ， 这 个 “额外 ”的 预先 获取 指令 将 大 大 减少 载 入 操 
作 消 耗 的 时 钟 周期 数 。 载 入 指令 执行 时 CPU 可 以 直接 从 缓存 中 读 取 需 
要 的 数据 。 不 过 由 于 新 增加 了 预先 获取 指令 ， 程 序 的 执行 路 径 长 度 、 
CPU 指令 数 都 会 相应 增加 。 因 此 ， 有 可 能 出 现 执行 路 径 变 长 ，CPU 时 
钟 周 期 利用 却 更 高 效 的 情况 。 当 然 ， 这 种 情况 出 现 的 机 会 不 一 定 很 
多 ， 也 有 可 能 情况 会 更 加 糟糕 。 

我 们 本 小 节 的 监控 方式 演示 都 会 按照 windows 篇 和 Linux 篇 ， 其 中 
Windows 针 对 的 是 windows7 操 作 系 统 ，Linux 针 对 的 是 CentosV6.5 操 作 
系统 。 

6.1.1.1 CPU 使 用 率 监控 工具 一 Windows 篇 

Windows 上 最 常用 的 CPU 使 用 率 监 控 工 具 是 任务 管理 器 和 性 能 监视 
器 (以 下 采用 英文 名 Perfmon) 。 这 两 个 监控 工具 用 不 同 颜色 区 分 用 户 
态 CPU 使 用 率 和 系统 态 CPU 使 用 率 。 

任务 管理 器 

Windows 任 务 管理 器 提供 了 有 关 计 算 机 性 能 的 信息 ， 并 显示 了 计算 
机 上 所 运行 的 程序 和 进程 的 详细 信息 。 如 果 连 接 到 网 络 ， 那 么 还 可 以 
查看 网 络 状态 并 迅速 了 解 网 络 是 如 何 工 作 的 。 

任务 管理 器 的 用 户 界面 提供 了 文件 、 选 项 、 查 看 、 窗 口 、 关 机 、 
帮助 等 六 大 菜单 项 ， 各 菜单 下 属 还 有 应 用 程序 、 进 程 、 性 能 、 联 网 、 
用 户 等 五 个 标签 页 ， 窗 口 底部 则 是 状态 栏 ， 从 这 里 可 以 查看 到 当前 系 
统 的 进程 数 、CPU 使 用 比率 、 更 改 的 内 存 容 量 等 数据 ， 默 认 设置 下 系 
统 每 隔 两 秒 钟 对 数据 进行 1 次 自动 更 新 ， 也 可 以 点 击 “ 查 看 -更 新 速度 ” 
菜单 重新 设置 。 在 windows7 中 使 用 Ctrl+Shift+Esc 组 合 键 调 出 ， 也 可 以 
用 鼠标 右键 点 击 任务 栏 选择 “任务 管理 器 >， 另外 Ctri+Alt+Delete 组 合 键 
也 可 以 出 现 ， 只 不 过 还 要 回 到 锁定 界面 。 

我 们 在 windows7 环 境 下 点 击 清单 6-1 所 示 程 序 ， 通 过 任务 管理 可 以 
获取 CPU 使 用 状态 ， 如 图 6-1 所 示 。 


inb 


图 6-1 任务 管理 器 截图 
上 图 中 ， 我 们 可 以 看 到 刚才 启动 的 Java 程 序 (图 片 中 的 javaw.exe) 
一 直 占 据 着 较 高 的 CPU 使 用 率 。 
具体 查看 性 能 一 览 ， 我 们 可 以 看 到 CPU 使 用 率 、 内 存 使 用 空间 
等 ， 从 图 6-2 中 可 以 看 到 CPU 的 使 用 率 抖 动 较 大 ， 这 是 因为 运行 的 程序 
本 身 的 随机 性 (随机 数字 控制 资源 占用 ) RA. 
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进程 数 : 94 CPU (FRR: 3796 DEAF: 67% 
图 6-2 任务 管理 器 查看 CPU 使 用 
性 能 监视 器 (Perfmon) 
Perfmon 提 供 了 图 表 化 的 系统 性 能 实时 监视 器 、 性 能 日 志和 和 警报 管 
理 ， 系 统 的 性 能 日 志 可 定义 为 二 进 制 文 件 、 文 本 文件 、SQLSERVER 表 
记录 等 方式 ， 可 以 很 方便 地 使 用 第 三 方 工具 进行 性 能 分 析 。 
Perfmon. exe 文 件 位 于 C: \Windows\System32B & F, Perfmon LAA 
通过 在 cmd 命 令 环境 下 直接 输入 就 能 打开 ， 如 图 6-3 所 示 。 


Gl 管理 员 : C:\Windows\system32\cmd.exe 


Microsoft Windows [hg 本 6.1.7601] ERES 
版 权 所 有 <c) 2609 Microsoft Corporation. 保留 所 有 权利 。 


iC: Users \zhoumingyao>Perf mon 


C: Users \zhoumingyao>,, 


图 6-3 启动 Pearfmon 工 具 
打开 的 工具 截图 如 图 6-4 所 示 。 
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图 6-4 Perfmon 工 具 截图 


点 击 性 能 监视 器 ， 然 后 点 击 添加 按钮 ， 可 以 添加 我 们 需要 的 性 能 
跟踪 指标 ， 如 图 6-5 所 示 。 
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图 6-5 Perfmon 添 加 性 能 跟踪 指标 
Perfmon 提 供 了 比较 全 面 的 系统 性 能 指标 ， 并 且 能 够 根据 性 能 管理 
的 要 求 定制 日 志 内 容 、 制 定 关键 指标 偏离 时 的 警报 措施 。 表 6-1 列 出 了 
Perfmon 可 以 监控 的 性 能 对 象 ， 每 一 个 性 能 对 象 项 下 包含 多 个 性 能 指标 
计数 器 。 这 里 列 出 了 所 有 的 选项 ， 包 括 内 存 、 磁 盘 、 网 络 等 ， 所 以 下 
面 各 子 章节 就 不 再 重复 。 


表 6-1 Perfmon 性 能 指标 表 


Browser performance object 由 衡量 通知 、 枚 举 和 其 他 浏览 器 传输 率 的 计数 器 


Cache performance object 包括 监督 文件 系统 缓存 (物理 内 存 上 尽 可 能 长 时 间 地 
存储 最 近 使 用 过 的 数据 以 便 访 问 该 数据 时 不 需 再 从 磁盘 上 读 取 的 那 一 部 分 内 
fF) 的 计数 器 。 因 为 应 用 程序 只 使 用 缓存 ， 因 此 该 缓存 可 作为 应 用 程序 VO 操 
作 的 指示 器 。 当 有 足够 内 存 时 ， 缓 存 可 增 大 ， 但 当 内 存 不 足 时 ， 绥 存 会 变 得 太 
小 而 无 法 使 用 

ICMP performance object. 包括 衡量 用 ICMP 协议 发 送 和 接收 消息 的 速度 的 计数 
器 。 它 还 包括 监督 ICMP 协议 错误 的 计数 器 


" j IP performance object 包括 衡量 使 用 IP 协 议 发 送 和 接收 的 他 数据 报 速度 的 计数 
器 。 它 还 包含 监督 IP 协议 错误 计数 器 


由 每 个 活动 命名 的 作业 对 象 收集 的 账户 和 处 理 器 使 用 数据 的 报告 
Job object Detail 显示 有 关 作业 对 象 中 的 活动 处 理 的 详细 的 操作 信息 


Logical Disk Logical Disk performance object 包含 监视 一 个 硬盘 或 固定 磁盘 驱动 器 的 逻辑 分 
区 的 计数 器 。Performance Monitor 用 邮 辑 磁盘 的 驱动 器 号 (如 : CO 来 识别 逻辑 
Ji t 


Memory Memory performance object 由 描述 计算 机 上 的 物理 和 虚拟 内 存 行为 的 计数 器 组 
成 。 物理 内 存 指 计算 机 上 的 随机 存 取 存储 器 的 数量 。 虚 拟 内 存 由 物理 内 存 和 磁 
盘 上 的 空间 组 成 。 许多 内 存 计数 器 监视 页 面 调度 〔 指 磁盘 与 物理 内 存 之 的 代码 
和 数据 页 的 移动 )。 过 多 的 页 面 调度 (内 存 不 足 的 一 种 表现 ) 可 引起 拖延 ， 会 


影响 整个 系统 处 理 效率 


NBT Connection NBT Connection performance object 包括 衡量 用 NBT 连接 在 一 台 本 地 计算 机 和 
- 台 远 程 计算 机 之 间 发 送 和 接收 字 节 的 速率 的 计数 器 。 该 连接 用 远程 计算 机 的 
名 称 来 识别 


Network Interface performance object 包括 衡量 通过 一 个 TCP/IP 网 络 连接 发 送 
和 接收 字 节 和 数据 包 的 速率 的 计数 器 。 它 包括 监督 连接 错误 的 计数 器 

Object performance object 包含 在 系统 中 监督 逻辑 对 象 的 计数 器 , 如 处 理 、 线程、 
多 用 户 终端 执行 程序 和 信号 量 , 这 个 信息 可 以 用 于 检测 计算 机 资源 的 不 必要 的 
消耗 。 每 个 对 象 需要 内 存 以 存储 有 关 对 象 的 基本 信息 


Paging File performance object 包括 监督 在 计算 机 上 的 分 页 文件 的 计数 器 。 分 页 
文件 指 为 备份 计算 机 上 已 用 物理 内 存 而 保留 的 磁盘 空间 


Physical Disk Physical Disk performance object 包 含 监视 计算 机 上 的 硬盘 或 固定 磁盘 驱动 器 的 
计数 器 。 磁 租用 于 存储 文件 、 程序 及 分 页 数据 并 且 通 过 读 取 检索 这 些 项 目 并 通 
过 记录 写 入 对 其 进行 更 改 。 物理 磁盘 计数 器 的 值 为 逻辑 磁盘 〈 由 磁盘 分 成 ) 值 
的 总 和 
显示 一 个 打印 列队 的 操作 统计 
Process Process performance object 包含 监视 运行 中 应 用 程序 和 系统 处 理 的 计数 器 。 所 
有 在 一 个 处 理 中 的 线程 均 共 享 同一 个 地 址 空间 并 可 以 访 间 同样 的 数据 


续 表 


Processor Processor performance object 包含 衡量 处 理 器 活动 方面 的 计数 器 , 处理 器 是 计算 
机 进行 算数 和 逻辑 计算 、 在 附属 件 起 始 操 作 及 运行 处 理 线程 的 部 分 。 一 台 计 算 
机 可 以 有 多 人 台 处 理 器 。 处 理 器 对 象 将 每 台 处 理 器 作为 对 象 的 范例 
Processor performance | 处 理 器 信息 
数据 包 计划 程序 中 的 管道 统计 数 
RAS Port RAS Port performance object 包括 监督 计算 机 上 的 RAS 设备 的 每 个 远程 访问 
服务 端口 的 计数 器 
RAS Total performance object 包含 将 计算 机 上 的 远程 访问 服务 (RAS) 设备 的 
也 有 端口 的 值 相 加 的 计数 器 


System performance object 包含 应 用 于 计算 机 上 不 止 一 个 组 件 处 理 器 范例 的 计 


Ads 


TCP performance object 包含 衡量 使 用 TCP 协议 发 送 和 接收 TCP Segment 速率 
的 计数 器 变量 。 它 包含 监督 在 每 个 TCP 连接 状态 下 的 TCP 连接 数目 的 计数 器 


终端 服务 信息 

每 次 终端 服务 会 话 资源 监督 

Thread Thread performance object 包括 衡量 线程 行为 方面 的 计数 器 ,一 个 线程 是 在 一 台 
处 理 器 上 执行 指令 的 基本 对 象 。 所 有 运行 的 处 理 至 少 有 一 个 线程 

UDP UDP performance object 包含 衡量 使 用 UDP 协议 发 送 和 接收 UDP 数据 报 的 速 
率 的 计数 器 。 它 包括 监督 UDP 协议 错误 的 计数 器 


WMI 适配器 返回 的 WMI 高 性 能 提供 程序 


这 里 添加 了 CPU 空 内 率 、 占 用 率 、 进 程 时 间 、 优 先 级 时 间 等 作为 
跟踪 指标 ， 生 成 的 实时 更 新 图 形 如 图 6-6 所 示 。 
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图 6-6 Perfmon 添 加 性 能 指标 
以 上 列 出 的 性 能 对 象 总 共有 上 百 个 性 能 指标 ， 我 们 关注 一 个 系统 
的 性 能 时 ， 不 可 能 关注 这 么 多 指标 ， 有 些 对 象 对 实际 的 应 用 系统 影响 
并 不 大 。 这 里 只 列 出 与 CPU 相关 的 指标 ， 如 表 6-2 所 示 。 其 他 的 指标 请 
看 对 应 的 子 章节 。 


表 6-2 Perfmon 的 CPU 指 标 


性 能 对 象 提供 的 信息 
% Idle Time 是 处 理 器 在 采样 期 间 空闲 的 时 间 的 百分比 


Processor %Processor Time % Processor Time 指 处 理 器 用 来 执行 非 闲置 线程 时 间 的 百分比 。 
计算 方法 是 , 测量 范例 间隔 内 非 闲置 线程 活动 的 时 间 ， 用 范例 间 
隔 减 去 该 值 。 这 个 计数 器 是 处 理 器 活动 的 主要 说 明 器 ， 显示 在 范 
例 间隔 时 所 观察 的 繁忙 时 间 平 均 百分比 
% User Time 指 处 理 器 处 于 用 户 模式 的 时 间 百 分 比 。 用 户 模式 是 
为 应 用 程序 、 环 境 分 系统 和 整数 分 系统 设计 的 有 限 处 理 模 式 
%Privileged Time % Privileged Time 是 在 特权 模式 下 处 理 线程 执行 代码 所 花 时 间 
的 百分比 。 当 调用 Windows 系统 服务 时 ， 此 服务 经 常 在 特权 模 
式 运行 ， 以 便 获取 对 系统 专 有 数据 的 访问 。 在 用 户 模 式 执行 的 线 
程 无 法 访问 这 些 数 据 。 对 系统 的 调用 可 以 是 直接 的 explicit) 或 
间接 的 (implicit)， 例 如 页 面 错误 或 间隔 


| Process | Creating Process ID value | Creating Process ID value 指 创建 该 进程 的 父 进程 号 
| Process — | Elapsed Time | 该 进程 运行 的 总 时 间 (用 秒 计算 ) 


prp] 由 这 个 处 理 现在 打开 的 句柄 总 数 。 这 个 数字 等 于 这 个 处 理 中 每 个 
线程 当前 打开 的 句柄 的 总 数 
ID Process ID Process 指 这 个 处 理 的 特别 的 识别 符 。ID Process 号 可 重复 使 

用 ， 所 以 这 些 ID Process 号 只 能 在 一 个 处 理 的 寿命 期 内 识别 那 
个 处 理 

uw pw. | 处 理 从 VO 操作 读 取 / 写 入 字 节 的 速率 。 这 个 计数 器 为 所 有 由 本 
处 理 产 生 的 包括 文件 、 网 络 和 设备 VO 的 活动 计数 

本 处 理 进行 读 取 / 写 入 VO 操作 的 速率 。 这 个 计数 器 为 所 有 由 本 处 
理 产生 的 包括 文件 、 网 络 和 设备 VO 的 活动 计数 


IOOther Bytes/sec 处 理 给 不 包括 数据 的 VO 操作 如 控制 操作 ) 字 节 的 速率 。 这 
个 计数 器 为 所 有 由 本 处 理 产生 的 包括 文件 、 网 络 和 设备 VO 的 
活动 计数 


IOOther Operations/sec | 本 处 理 进 行 非 读 取 / 写 入 vo 操作 的 速率 。 例 如 ， 控 制 性 能 ， 这 
个 计数 器 为 所 有 由 本 处 理 产生 的 包括 文件 、 网 络 和 设备 IO 的 
活动 计数 


me qm 1 处 理 从 VO. 操作 读 取 字 节 的 速率 。 这 个 计数 器 为 所 有 由 本 处 理 
产生 的 包括 文件 、 网 络 和 设备 VO 的 活动 计数 
本 处 理 进行 读 取 VO 操作 的 速率 。 这 个 计数 器 为 所 有 由 本 处 理 
产生 的 包括 文件 、 网 络 和 设备 VO 的 活动 计数 
See Oe 处 理 从 VO 操作 写 入 字 节 的 速率 。 这 个 计数 器 为 所 有 由 本 处 理 
产生 的 包括 文件 、 网 络 和 设备 
本 处 理 进行 写 入 VO. 操作 的 速率 。 这 个 计数 器 为 所 有 由 本 处 理 
产生 的 包括 文件 、 网 络 和 设备 TO 的 活动 计数 


性 能 对 象 提供 的 信息 


Page Faults/sec Page Faults/sec 指 在 这 个 进程 中 执行 线程 造成 的 页 面 错误 出 现 的 
速度 。 当 线程 引用 了 不 在 主 内 存 工作 集中 的 虚拟 内 存 页 即 会 出 现 
Page Fault。 如 果 它 在 备用 表 中 〈 即 已 经 在 主 内 存 中 ) 或 另 一 个 
共享 页 的 处 理 正在 使 用 它 ， 就 会 引起 无 法 从 磁盘 中 获取 页 

Page File Bytes Page File Bytes 指 这 个 处 理 在 Paging file 中 使 用 的 最 大 字 节 数 。 
Paging File 用 于 存储 不 包含 在 其 他 文件 中 的 由 处 理 使 用 的 内 存 
页 。Paging File 由 所 有 处 理 共享 ， 并 且 Paging File 空间 不 足 会 
防止 其 他 处 理 分 配 内 存 


pem em | Page File Bytes Peak 指 这 个 处 理 在 Paging files 中 使 用 的 最 大 数 
量 的 字 节 


Pool Nonpaged Bytes Pool Nonpaged Bytes 指 在 非 分 页 池 中 的 字 节 数 , 非 分 页 池 是 指 系 
统 内 存 〈 操 作 系 统 使 用 的 物理 内 存 ) 中 可 供 对 象 〈 指 那些 在 不 处 
于 使 用 时 不 可 以 写 入 磁 扒 上 而 且 只 要 分 派 过 就 必须 保留 在 物理 
内 存 中 的 对 象 ) 使 用 的 一 个 区 域 。 这 个 计数 器 仅 显 示 上 一 次 观察 
的 值 ， 而 不 是 一 个 平均 值 

PoolPaged Bytes Pool Paged Bytes 指 在 分 页 池 中 的 字 节 数 , 分 页 池 是 系统 内 存 ( 操 
作 系 统 使 用 的 物理 内 存 ) 中 可 供 对 象 〈 在 不 处 于 使 用 时 可 以 写 入 
磁盘 的 ) 使 用 的 一 个 区 域 。 这 个 计数 器 仅 显示 上 一 次 观察 的 值 ; 
而 不 是 一 个 平均 值 


[| 这 次 处 理 的 当前 基本 优先 权 。 在 一 个 处 理 中 的 线程 可 以 根据 处 理 
的 基本 优先 权 提高 或 降低 自己 的 基本 优先 权 
me ee | Private Bytes 指 这 个 处 理 不 能 与 其 他 处 理 共享 的 、 已 分 配 的 当前 
字 节 数 


Thread Count 在 这 次 处 理 中 正在 活动 的 线程 数目 。 指 令 是 在 一 台 处 理 器 中 基本 
的 执行 单位 ， 线 程 是 指 执行 指令 的 对 象 。 每 个 运行 处 理 至 少 有 一 
个 线程 
Process Virtual Bytes Virtual Bytes 指 处 理 使 用 的 虚拟 地 址 空间 的 以 字 节 数 显示 的 当 
前 大 小 。 使 用 虚拟 地 址 空间 不 一 定 是 指 对 磁盘 或 主 内 存 页 的 相应 
的 使 用 。 虚 拟 空间 是 有 限 的 ， 可 能 会 限制 处 理 加 载 数 据 库 的 能 力 


boa pO Virtual Bytes Peak 指 在 任何 时 间 内 该 处 理 使 用 的 虚拟 地 址 空间 
字 节 的 最 大 数 


Process Working Set Working Set 指 这 个 处 理 的 Working Set 中 的 当前 字 节 数 ， 
Working Set 是 在 处 理 中 被 线程 最 近 触 到 的 那个 内 存 页 集 。 如 果 
计算 机 上 的 可 用 内 存 处 于 阅 值 以 上 ,即使 页 不 在 使 用 中 , 也 会 留 
在 一 个 处 理 的 Working Set 中 。 当 可 用 内 存 降 到 阅 值 以 下 ， 将 从 
Working Set 中 删除 页 。 如 果 需 要 页 时 ， 它 会 在 离开 主 内 存 前 软 
故障 返回 到 Working Set 中 


ma Working Set Peak 指 在 任何 时 间 这 个 在 处 理 的 Working Set 的 最 
大 字 节 数 


Windows 提 供 了 Perfmon 的 两 种 部 署 方式 ， 本 地 监控 和 远程 监控 。 
本 地 监控 产生 的 日 志文 件 默 认 保 存 路 径 是 C: \perflogs 目 录 ， 在 设置 时 
可 以 根据 需要 在 “日 志文 件 ” 项 下 修改 。 本 地 监控 产生 的 日 志文 件 除了 
可 以 在 本 机 用 性 能 监视 器 进行 观测 外 ， 还 可 以 外 传 到 第 三 方 监测 分 析 
平台 上 。 远程 监 控 可 以 实现 对 局 域 网 内 多 人 台 监 控 目 标 进 行 集中 采样 监 
控 ， 其 前 提 是 监控 主机 与 目标 主机 之 间 必 须 建 立信 任 关 系 ， 并 且 打 开 
相应 的 远程 访问 控制 。 在 访问 控制 比较 严格 的 环境 下 ， 远 程 监控 难以 
部 署 。 部 署 Permon 时 还 应 该 考虑 日 志文 件 的 存放 问题 ， 如 果 要 长 时 间 
收集 性 能 数据 ， 最 好 调整 一 下 采样 间隔 时 间 ， 如 果 采 样 间 隔 时 间 设 置 
得 太 小 ， 日 志文 件 会 快速 增加 。 

Perfmon 的 管理 也 有 两 种 方法 ， 控 制 台 管理 和 命令 行 方式 管理 。 可 
以 通过 运行 Perftmon.msc 调 出 性 能 管理 的 控制 台 ， 并 根据 监控 策略 制 
i 证 、 管 理 控制 台 。Perftmon 的 另 一 种 管理 方式 是 命令 行 方式 ，Windows 
提供 了 一 个 专门 用 于 管理 性 能 监控 的 命令 --Logman， 它 不 仅 能 够 在 命 
令 行 上 启动 和 停止 日 志 会 话 ， 还 能 够 从 命令 行 创建 新 的 日 志 会 话 。 

Typeperf 

Windows 提 供 了 一 个 显示 当前 性 能 指标 的 命令 ，Typeperf o 
Typeperf 能 方便 地 采集 到 系统 性 能 数据 ， 但 仅仅 是 获取 数据 ， 并 不 产生 
警报 和 日 志 记 录 的 动作 。 用 Typeperf 可 以 得 到 前 面 提 到 的 Perfmon 的 所 
有 指标 值 。Typeperf 的 标准 输出 是 屏幕 显示 ， 我 们 可 以 通过 输出 重 定 义 
将 结果 输出 到 文本 文件 当中 ， 并 将 结果 文件 传 给 第 三 方 系统 。Windows 
typeperf 是 收集 操作 系统 性 能 统计 数据 的 命令 行 工 具 。typeperf 可 以 在 
Windows 命 令 提 示 符 窗口 中 运行 ， 或 者 作为 脚本 语句 在 bar 或 cm 的 文件 
中 运行 。 这 种 应 用 方式 下 ，Typeperf 的 动作 由 第 三 方 软件 根据 需要 来 管 
理 ， 也 可 以 通过 定制 计划 任务 来 定时 局 动 。 

Typeperf 的 使 用 方式 如 清单 6-2 所 示 。 


代码 清单 6-2 Typeperf 使 用 方式 
Microsoft (R) TypePerf.exe (5.2.3790.0) 
(C) Microsoft Corporation. All rights reserved. 
Typeperf 将 性 能 数据 写 入 命令 窗口 或 日 志文 件 。 要 停止 Typeperf， 请 按 CTRL+C， 
用 法 ; 
typeperf ( «counter [counter ...]> 
| -cf «filename» 
| -q [object] 
| -qx [object] 
) [options] 
参数 
«counter [counter ...]» 要 监视 的 性 能 计数 器 。 
à: 
-? 显示 跟 上 下 文 相关 的 帮助 。 
-f «CSV|TSV|BIN|SQL» MELHER, RER CSV, 
-cf <filename> 含有 监视 的 性 能 计数 器 的 文件 ， 一 个 计数 器 一 行 。 
-si «[[hh:]mm:]ss» 示例 间 的 时 间 。 默 认 值 是 1 秒 。 
-o «filename» 输出 文件 或 SQL 数据 库 的 路 径 。 默 认 值 为 STDOUT, 


-q [object] 列 出 已 安装 的 计数 器 (无 实例 ) 。 要 列 出 某 个 对 象 的 计数 器 ， 包 括 对 象 
名 , 如 Processor, 
-qx [object] 列 出 已 安装 的 计数 器 ( 带 实例 ) 。 要 列 出 某 个 对 象 的 计数 器 ， 包 括 对 象 


A, + Processor, 


-sc «samples» 要 收集 的 示例 数量 。 默 认 值 为 ， 在 CTRL+C 之 前 都 进行 采样 。 


-config «filename» 含有 命令 选项 的 设置 文件 。 
-s «computer name» 在 计数 器 路 径 中 没有 指定 服务 器 的 情况 下 要 监视 的 服务 器 。 


不 用 提示 对 所 有 问题 都 回答 yes, 
RE: 


Counter 是 性 能 计数 器 的 全 名 ， 格 式 为 
"//<Computer>/<Object> («Instance») /<Counter>"; 
例如 "//Serverl/Processor(0)/$ User Time", 
例如 : 
typeperf "/Processor( Total)/$ Processor Time" 
typeperf -cf counters.txt -si 5 -SC 50 -f TSV -o domain2.tsv 
typeperf -qx PhysicalDisk -o counters.txt 


typeperf 也 可 以 被 用 来 监控 运行 队列 长 度 。typeperf 接 受 性 能 计数 器 
的 名 字 作 为 参数 ， 然 后 以 列表 方式 打印 性 能 数据 。 性 能 计数 器 
\System\Processor Queue Length 监 控 运 行 队列 长 度 ， 所 以 可 以 使 用 下 列 
命令 typeperf ^System Processor Queue Length” 监 控 运 行 队列 长 度 。 

6.1.1.2 CPU 使 用 率 监控 工具 一 Linux 篇 

GNOME System Monitor 

Linux 上 可 以 使 用 图 形 化 工具 GNOME System Monitor 2 CPU fs FH 
率 。 运 行 后 界面 如 图 6-7 所 示 ， 可 以 清楚 地 看 到 CPU、 内 存 、 网 络 1/O 等 
各 项 数据 指标 及 历史 数据 。 


o System Monitor 
File View Settings Help 


Process Table System Load 


CPU History 
100% 


€ CPU 1(57.14%)| . 
@ CPU 2 (53.33%) 


€ CPU 1: 52.0% @ CPU 2: 45.3% 


Memory and Swap History 
2.95 GiB 


2.36 GiB 
1.77 GiB 
1.18 GiB 
0.59 GiB 
0.00 GiB 
@ Memory : 0.43 GiB of 2.0 GiB @ Swap : 0.00 GiB of 2.9 GiB 
Network History 
165 KiB/s 
132 KiB/s 
99 KiB/s 
66 KiB/s 
0 KiB/s 
@ Receiving : 45.0 KiB/s @ Sending : 35.0 KiB/s 


0 processes CPU: 90% Memory: 442.0 MiB / 2.0 GiB Swap: 0 B / 2.9 GiB 


图 6-7 GNOME 使 用 

因为 图 形 化 界面 采用 的 机 会 较 少 ，Linux 下 有 大 量 的 命令 行 共同 存 
在 ， 所 以 这 里 不 多 做 介绍 。 

前 面 说 了 ， 除 了 图 形 化 工具 以 外 ，Linux 也 提供 了 监控 CPU 使 用 率 
的 命令 行 工具 ， 可 以 通过 保留 文本 形式 的 保留 CPU 使 用 率 运 行 历史 。 
这 类 型 的 工具 很 多 ， 例 如 vmstat、top、Ppidstat 等 ， 下 面 将 逐一 介绍 。 

Top 命 令 

Top 命 令 不 仅 包括 CPU 使 用 率 也 包括 进程 统计 数据 和 内 存 使 用 率 。 
Top 是 一 个 动态 显示 过 程 ， 即 可 以 通过 用 户 按键 来 不 断 刷 新 当前 状态 。 
如 果 在 前 台 执 行 该 命令 ， 它 将 独占 前 台 ， 直 到 用 户 终止 该 程序 为 止 。 
比较 准确 地 说 ，Top 命 令 提供 了 实时 的 对 系统 处 理 器 的 状态 监视 ， 它 将 
显示 系统 中 CPU 最 “敏感 ”的 任务 列表 。 该 命令 可 以 按 CPU 使 用 。 内 存 使 


用 和 执行 时 间 对 任务 进行 排序 ;而且 该 命令 的 很 多 特性 都 可 以 通过 区 
互 式 命令 或 者 在 个 人 定制 文件 中 进行 设 定 。Top 使 用 截图 如 图 6-8 所 示 。 


top - 18:58:56 up 19 days, 8:48， 6 users, oad average: 0.06, 0.06, 0.08 
Tasks: 539 total, 1 running, 534 sleeping, 3 stopped, 1 zombie 

Cpu(s): 0.0%us, 0.0%sy, 0.0%ni, 99.99 id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st 
Mem: 32830232k total, 9825264k used, 23004968k free, 329356k buffers 

Swap: 8191996k total, 544088k used, 7647908k free, 4671360k cached 


VIRT RES 5 % MEM IM COMMAND 
5957m 240m 5136 Java 

15416 1596 932 top 

19360 564 340 init 
kthreadd 
migration/0 
ksoftirad/0 
stopper /0 
watchdog/0 
migration/1 
stopper /1 
ksoftirqd/1 
wat chdog/1 
migration/2 
stopper /2 
ksoftirqd/2 
wat chdog/2 
migration/3 
stopper /3 
ksoftirgd/3 


0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
0 
Q 


poooooooooooooooo 
poooooooooooooooo 
poooooooooooooooo 

Ut Un Un Uy Uo Un Cn Un Un Un Un Cn Uo Ui Un Un Un 29 Un 
pooooooooooooooooooo 
pooooooooooooooocoocwuu 
Dooooooooooooooooooo 
pDoooooooooooooooooococOo 
poooooooooooooodocooocwcu 


图 6-8 TOP 使 用 截图 

统计 信息 区 前 五 行 是 系统 整体 的 统计 信息 。 第 一 行 是 任务 队列 信 
息 。 第 二 、 三 行为 进程 和 CPU 的 信息 ， 当 有 多 个 CPU 时 ， 这 些 内 容 可 
能 会 超过 两 行 。 第 四 、 五 行为 内 存 信息 。 

Top 命 令 所 有 的 列 解释 如 下 所 示 。 

PID: 表示 进程 id。 

PPID: 表示 父 进程 id。 

UID: 表示 进程 所 有 者 的 用 户 id。 

USER: 表示 进程 所 有 者 的 用 户 名 。 

GROUP: 表示 进程 所 有 者 的 组 名 。 
" TTY: 表示 局 动 进 程 的 终端 名 。 不 是 从 终端 启动 的 进程 则 显示 
9? . 

PR: 表示 优先 级 。 

NInice: 负 值 表示 高 优先 级 ， 正 值 表 示 低 优先 级 。 

%CPU: 表示 上 次 更 新 到 现在 的 CPU 时 间 占 用 百分比 。 


TIME: 表示 进程 使 用 的 CPU 时 间 总 计 ， 单 位 秒 。 

TIME+: 表示 进程 使 用 的 CPU 时 间 总 计 ， 单 位 1/100 秒 。 

%MEM: 表示 进程 使 用 的 物理 内 存 百 分 比 。 

VIRT : 表示 进程 使 用 的 虚拟 内 存 总 量 ， 单 位 KB。 
VIRT=SWAP+RES。 

SWAP: 表示 进程 使 用 的 虚拟 内 存 中 ， 被 换 出 的 大 小 ， 单 位 KB。 

RES: 表示 进程 使 用 的 、 未 被 换 出 的 物理 内 存 大 小 ， 单 位 KB。 
RES=CODE+DATA。 

CODE: 表示 可 执行 代码 占用 的 物理 内 存 大 小 ， 单 位 KB。 

DATA: 表示 可 执行 代码 以 外 的 部 分 (数据 段 + 栈 ) 占用 的 物理 内 
存 大 小 ， 单 位 KB。 

SHR: 表示 共享 内 存 大 小 ， 单 位 KB。 

nFLT: 表示 页 面 错误 次 数 。 

nDRT: 表示 最 后 一 次 写 入 到 现在 ， 被 修改 过 的 页 面 数 。 

HTop 

HTop 是 Linux 系 统 中 的 一 个 互动 的 进程 查看 器 ， 一 个 文本 模式 的 应 
用 程序 (在 控制 台 或 者 X 终 端 中 ) ， 需 要 ncurses。 与 Linux 传 统 的 top 相 
比 ，htop 更 加 入 性 化 。 它 可 让 用 户 交 互 式 操 作 ， 支 持 颜 色 主 题 ， 可 横向 
或 纵向 滚动 浏览 进程 列表 ， 并 支持 鼠标 操作 。htop 命 令 还 可 以 显示 每 个 
进程 的 内 存 实 时 使 用 率 。 它 提供 了 所 有 进程 的 常 驻 内 存 大 小 、 程 序 总 
内 存 大 小 、 共 享 库 大 小 等 的 报告 。 列 表 可 以 水 平 有 久 垂 直 滚 动 。 

与 top 相 比 ，htop 有 以 下 优点 : 

(1) 可 以 横向 或 纵向 滚动 浏览 进程 列表 ， 以 便 看 到 所 有 的 进程 和 
完整 的 命令 行 ; 

(2) 在 启动 上 ， 比 top 更 快 ; 

(3) 杀 进 程 时 不 需要 输入 进程 号 ; 

(4) htop 支 持 鼠 标 操作 。 


vmstat 


vmstat 命 令 报 告 关于 内 核 线 程 的 统计 信息 ， 包 括 处 于 运行 和 等 待 队 
列 、 内 存 、 页 面 调度 、 磁 盘 、 系 统 中 断 、 系 统 调 用 、 上 下 文 切换 和 
CPU 活动 的 内 核 线 程 。 所 报告 的 CPU 活动 是 用 户 方式 、 系 统 方式 、 空 
闲 时 间 和 等 待 磁盘 IO 的 百分比 详细 分 类 。 常 规 的 vmstat 命 令 输出 如 清 
单 6-3 所 示 。 


代码 清单 6-3 vmstat 命令 输出 


[root@nodel:5 zhoumingyao]# vmstat 


r b swpd free buff cache si so bi bo in cs us sy id wa st 
1 0 544104 23080516 329112 4670948 0 0 0 1 1 109900 


如 果 是 虚拟 机 器 ，Linux 的 vmstat 显 示 所 有 虚拟 处 理 器 的 总 CPU 使 
用 率 。 无 论 物理 机 器 、 虚 拟 机 器 ， 两 者 的 vmstat 都 有 命令 行 选 项 可 以 设 
定 报告 的 时 间 间 隔 〈 秒 级 ) 。 如 果 不 指定 vmstat 的 报告 间隔 ， 则 输出 自 
从 系统 最 近 一 次 启动 以 来 的 总 CPU 使 用 率 。 如 果 指 定 间 隔 ， 统 计数 据 
的 第 一 行 则 是 最 近 一 次 启动 以 来 所 有 数据 的 总 和 ， 不 过 通常 来 说 都 可 
以 忽略 不 计 。 如 果 使 用 vmstat 命 令 时 不 带 任 何 选 项 ， 或 者 只 带 有 间隔 时 
间 和 任意 的 计数 参数 ， 例 如 vmstat 2 10; 那么 第 一 行 数 字 为 自 系 统 重新 
引导 以 来 的 平均 值 。 

如 果 需 要 检查 CPU 占有 率 是 否 很 高 ，Linux 操 作 系 统 也 可 以 使 用 
vmastat 命 令 查 看 。 我 在 服务 器 上 运行 了 一 个 阶段 性 占用 CPU 的 进程 后 ， 
情况 如 图 6-9 所 示 。vmstat 输 出 的 第 一 列 是 运行 队列 长 度 ， 值 是 运行 队 
列 中 轻 量 级 进程 的 实际 数量 。 

e4 ~|# vmstat 3 10 
pem Cri us sy idm st 


1 0 0100 0 
1113826 


uff cache 
30956788 345480 454568 
30956996 345480 454568 
30957120 345480 454568 
30957272 345480 454568 
30957404 345484 454568 


30957460 345484 454568 
30957460 345484 454568 
30957460 345484 454568 
30957460 345484 454568 
30957460 345484 454568 


图 6-9 检查 CPU 占有 率 
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b 
0 
0 
0 
0 
0 
0 
0 
0 
0 
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ri 表示 运行 队列 〈 就 是 说 多 少 个 进程 真 的 分 配 到 CPU) ， 当 这 个 
值 超过 了 CPU 数 目 ， 就 会 出 现 CPU 瓶 颈 了 。 这 个 也 和 top 的 负载 有 关 
系 ， 一 般 负 载 超 过 了 3 就 比较 高 ， 超 过 了 5 就 高 ， 超 过 了 10 就 不 正常 
了 ， 服 务 器 的 状态 很 危险 。top 的 负载 类 似 每 秒 的 运行 队列 。 如 果 运 行 
队列 过 大 ， 表 示 你 的 CPU 很 繁忙 ， 一 般 会 造成 CPU 使 用 率 很 高 。 

b: 表示 阻塞 的 进程 。 

swpd: 表示 虚拟 内 存 已 使 用 的 大 小 ， 如 果 大 于 0， 表 示 你 的 机 器 物 
理 内 存 不 足 了 ， 如 果 不 是 程序 内 存 泄漏 的 原因 ， 那 么 你 应 该 升级 内 存 
或 者 把 耗 内 存 的 任务 迁移 到 其 他 机 器 。 

free: 表示 空 朵 的 物理 内 存 的 大 小 。 

buff: 表示 目录 里 面 有 什么 内 容 ， 权 限 等 的 缓存 。 

cache: 直接 用 来 记忆 我 们 打开 的 文件 ， 给 文件 做 缓冲 ， 把 空 内 的 
物理 内 存 的 一 部 分 拿 来 做 文件 和 目录 的 缓存 ， 是 为 了 提高 程序 执行 的 


si: 每 秒 从 磁盘 读 入 虚拟 内 存 的 大 小 ， 如 果 这 个 值 大 于 0， 表 示 物 
理 内 存 不 够 用 或 者 内 存 泄露 了 ， 要 碍 找 消耗 内 存 进 程 解决 抒 。 

so: 每 秒 虚 拟 内 存 写 入 磁盘 的 大 小 ， 如 果 这 个 值 大 于 0， 同 上 。 

bi: 块 设备 每 秒 接收 的 块 数 量 ， 这 里 的 块 设备 是 指 系统 上 所 有 的 磁 
盘 和 其 他 块 设 备 ， 默 认 块 大 小 是 1024Byte。 

bo: 块 设 备 每 秒 发 送 的 块 数量 ， 例 如 我 们 读 取 文件 ，bo 就 要 大 于 
0。bi 和 bo 一 般 都 要 接近 0， 不 然 就 是 IO 过 于 频繁 ， 需 要 调整 。 

in: 每 秒 CPU 的 中 断 次 效 ， 包 括 时 间 中 断 。 

cs: 每 秒 上 下 文 切换 次 数 ， 例 如 我 们 调用 系统 钞 效 ， 融 要 进行 上 下 
文 切换 ， 绪 程 的 切换 ， 也 要 进程 上 下 文 切换 ， 这 个 值 要 越 小 越 好 ， 太 
大 了 ， 要 考虑 调 低 线程 或 者 进程 的 数目 ， 例 如 在 Apache 和 Nginx 这 种 
Web 服 务 器 中 ， 我 们 一 般 做 性 能 测试 时 会 进行 几 千 并 发 甚至 几 万 并 发 的 
测试 ， 选 择 Web 服 务 器 的 进程 可 以 由 进程 或 者 线程 的 峰值 一 直下 调 ， 压 
测 ， 直 到 cs 到 一 个 比较 小 的 值 ， 这 个 进程 和 线程 数 就 是 比较 合适 的 值 
了 。 系 统 调 用 也 是 ， 每 次 调用 系统 水 数 ， 我 们 的 代码 就 会 进入 内 核 空 
间 ， 导 致 上 下 文 切换 ， 这 个 是 很 耗资 源 ， 也 要 尽量 避免 频 繁 调用 系统 


国 数 。 上 下 文 切换 次 数 过 多 表示 你 的 CPU 大 部 分 浪费 在 上 下 文 切换 ， 
导致 CPU 干 正经 事 的 时 间 少 了 ，CPU 没 有 充分 利用 ， 是 不 可 取 的 。 

us: 用 户 CPU 时 间 。 

sy: 系统 CPU 时 间 ， 如 果 太 高 ， 表 示 系 统 调用 时 间 长 ， 例 如 是 IO 
操作 频繁 。 

id: 空闲 CPU 时 间 ， 一 般 来 说 ，id+us+sy=100， 一 般 我 认为 id 是 空 
闲 CPU 使 用 率 ，us 是 用 户 CPU 使 用 率 ，sy 是 系统 CPU 使 用 率 。 

wt: 等 待 TO CPU 时 间 。 

注意 ， 作 为 一 个 CPU 监视 器 ，vmstat 命 令 优 于 iostat 命 令 ， 因 为 
vmstat 命 令 是 滚动 的 ， 使 得 每 行 的 输出 更 容易 扫描 ， 并 且 如 果 有 很 多 磁 
盘 连 接 到 系统 中 ， 由 此 所 涉及 的 开销 更 少 。 下 面 的 示例 可 以 帮助 您 识 
别 一 个 程序 失控 时 或 CPU 过 度 密 集 以 至 于 不 能 在 一 个 多 用 户 环境 中 运 
行 时 的 情况 。 


代码 清单 -4 “识别 程序 失控 示例 


# vmstat 2 

kthr memory page faults cpu 

r b am fre re pi po fr sr cy in sy cs us sy id wa 
1 0 22478 1677 0 0 0 0 0 0188 1380 157 57 32 0 10 
1 0 22506 1609 0 0 0 0 0 0214 1476 186 48 37 0 16 
0 0 22498 1582 0 0 0 0 0 0248 1470 226 55 36 0 9 

2 0 22534 1445 0 0 0 0 0 0238 903 239 77 23 0 0 

2 0 22534 1445 0 0 0 0 0 0209 1142 205 72 28 0 0 

2 0 22534 1426 0 0 0 0 0 0189 1220 212 74 26 0 0 

3 0 22534 1410 0 0 0 0 0 0255 1704 268 70 30 0 0 

2 1 22557 1365 0 0 0 0 0 0383 977 216 72 28 0 0 

2 0 22541 1356 0 0 0 0 0 02371418 209 63 33 0 4 

1022924 1350 0 0 0 0 © 024) 1348 173 52 32 0 16 
1022546 1203 0 0 0 0 0 02171473 1805135 0 14 


上 面 的 输出 显示 了 在 一 个 死 循环 中 将 程序 引入 到 一 个 繁忙 的 多 用 
户 系统 中 所 带 来 的 效果 。 头 三 个 报告 表明 系统 平衡 在 50% 人 55% 的 用 
户 、30% 玉 35% 的 系统 和 10% 信 15% 的 IO 等 待 处 。 当 循环 程序 开始 运 
行 ， 所 有 可 用 的 CPU 周期 都 被 耗 用 。 因 为 循环 程序 不 进行 1JO， 所 以 它 
可 以 占有 前 面 因 为 VO 等 待 而 未 用 过 的 所 有 周期 。 更 糟 的 是 ， 这 代表 当 
一 个 有 用 进程 放弃 CPU 时 ， 始 终 有 一 个 进程 准备 接管 CPU。 因 为 循环 
程序 的 优先 级 与 所 有 其 他 前 台 进 程 一 样 ， 所 以 当 另 一 个 进程 变 得 可 分 
派 时 它 也 没 必 要 一 定 得 放弃 CPU。 该 程序 运行 大 约 10 秒 钟 (五 个 报 
告 )， 然 后 由 Vmstat 命 令 报告 的 活动 恢复 到 较 正常 的 模式 。 

最 佳 利 用 是 让 CPU 在 100% 的 时 间 中 工作 。 这 适用 于 单 用 户 系统 的 
情况 ， 不 需要 共享 CPU。 总 的 来 说 ， 如 果 us+sy 时 间 低 于 90%， 则 不 认 
为 单 用 户 系统 是 CPU 受 限 制 的 。 但 是 ， 如 果 在 一 个 多 用 户 系统 中 us+sy 
时 间 超 过 80%， 则 进程 可 能 要 人 花 时 间 在 运行 队列 中 等 待 。 响 应 时 间 和 吞 
吐 量 会 受 损害 。 

Sar 工 具 

sar (System Activity Reporter 系 统 活动 情况 报告 ;是 目前 Linux 上 最 
为 全 面 的 系统 性 能 分 析 工 具 之 一 ， 可 以 从 多 方面 对 系统 的 活动 进行 报 
告 ， 包 括 : 文件 的 读 写 情况 、 系 统 调用 的 使 用 情况 、 磁 盘 IO、CPU 效 
率 、 内 存 使 用 状况 、 进 程 活动 及 IPC 有 关 的 活动 等 。 

命令 格式 是 这 样 的 ，sar [options] [-A] [-o file] t [n]， 其 中 各 选项 代 
表 的 意义 如 下 所 示 。 

t 表 示 采 样 间 隔 ，n 为 采样 次 数 ， 默 认 值 是 1。 

-0 file 表 示 将 命令 结果 以 二 进 制 数 形式 存放 在 文件 中 ，file 是 文件 
名 。 

options 为 命令 行 选项 。 

-A: 所 有 报告 的 总 和 。 

-u: 输出 CPU 使 用 情况 的 统计 信息 。 

-v: 输出 inode、 文 件 和 其 他 内 核 表 的 统计 信息 。 

-d: 输出 每 一 个 块 设备 的 活动 信息 。 

ri 输出 内 存 和 交换 空间 的 统计 信息 。 

-b: 显示 W/O 和 传送 速率 的 统计 信息 。 


-a. 
-C， 
-R: 
-y: 


-W 


文件 读 写 情况 。 

输出 进程 统计 信息 ， 每 秒 创建 的 进程 数 。 
输出 内 存 页 面 的 统计 信息 。 
终端 设备 活动 情况 。 

: 输出 系统 交换 活动 信息 。 


例如 ， 每 10 秒 采样 一 次 ， 连 续 采 样 3 次 ， 观 察 CPU 的 使 用 情况 ， 并 


ma 
ap 


将 采样 结果 以 二 进 制 数 形式 存 入 当前 目录 下 的 文件 test 中 ， 需 键入 如 下 
令 


sar-u-o test 10 3 
屏幕 显示 如 清单 6-5 所 示 。 


代码 清单 6-5 Sar 命令 输出 


17 
17 
17 
17 


:06:16 CPU user nice system Siowait %steal Sidle 
:06:26 all 0.00 0.00 0.20 0.00 0.00 99.80 
:06:36 all 0.00 0.00 0.20 0.00 0.00 99.80 
:06:46 all 0.00 0.00 0.10 0.00 0.00 99.90 


Average: all 0.00 0.00 0.17 0.00 0.00 99.83 
输出 项 说 明 如 下 。 
CPU: all 表示 统计 信息 为 所 有 CPU 的 平均 值 。 
%user: 显示 在 用 户 级 别 (application) 运行 使 用 CPU 总 时 间 的 百 


分 比 。 


%nice: 显示 在 用 户 级 别 ， 用 于 nice 操 作 ， 所 占用 CPU 总 时 间 的 百 


分 比 。 


%system: 在 核心 级 别 (kernel) 运行 所 使 用 CPU 总 时 间 的 百 分 


比 。 


%iowait: 显示 用 于 等 待 O 操 作 占 用 CPU 总 时 间 的 百分比 。 
%steal : 管理 程序 (hypervisor) 为 另 一 个 虚拟 进程 提供 服务 而 等 
待 虚拟 CPU 的 百分比 。 


%idle: 显示 CPU 空 朵 时 间 占 用 CPU 总 时 间 的 百分比 。 


以 上 输出 结果 如 果 出 现 以 下 情况 ， 有 对 应 的 症状 表示 。 

(1) 若 %iowait 的 值 过 高 ， 表 示 硬 盘存 在 IO 瓶颈 ; 

(2) 若 %idle 的 值 高 但 系统 响应 慢 时 ， 有 可 能 是 CPU 等 待 分配 内 
存 ， 此 时 应 加 大 内 存 容量 ; 

(3) 若 %idle 的 值 持续 低 于 1， 则 系统 的 CPU 处 理 能 力 相 对 较 低 ， 
表明 系统 中 最 需要 解决 的 资源 是 CPU。 

如 果 要 查看 二 进 制 文件 test 中 的 内 容 ， 可 以 通过 如 下 sar 命 令 来 完 


sar -u -f test 
mpstat 命 令 
Linux 还 提供 命令 行 工 具 mpstat， 以 列表 方式 展示 每 个 虚拟 处 理 器 
的 CPU 使 用 率 。 
直接 运行 mpstat 命 令 ， 输 出 如 下 所 示 。 


代码 清单 -6 mpstat 命令 输出 

[root@nodel:5 zhoumingyao]# mpstat 

Linux 2.6.32-504.e16.x86 64 (nodel) 20154094 10H x86 64. (24 CPU) 

188 344134 CPU susr nice  $sys$iowait %irq %soft %steal $guest idle 
188 344139 all 0.48 0.00 0.04 0.01 0.00 0.00 0.00 0.00 99.47 


清单 输出 的 内 容 包 括 了 几 个 字段 ， 我 们 逐一 解释 。 

9ouser: 表示 处 理 用 户 进程 所 使 用 CPU 的 百分比 。 用 户 进程 是 用 于 
应 用 程序 (如 Oracle 数 据 库 ) 的 非 内 核 进 程 。 在 本 示例 输出 中 ， 用 户 
CPU 百分比 非常 低 。 

%nice: 表示 使 用 nice 命令 对 进程 进行 降级 时 CPU 的 百分比 。 在 之 
前 的 部 分 中 已 经 对 nice 命 令 进 行 了 介绍 。 简 单 来 说 ，nice 命令 更 改进 程 
的 优先 级 。 

%system: 表示 内 核 进程 使 用 的 CPU 百分比 。 

%iowait: 表示 等 待 进行 IO 所 使 用 的 CPU 时 间 百 分 比 。 

%irg: 表示 用 于 处 理 系 统 中 断 的 CPU 百分比 。 


%soft: 表示 用 于 软件 中 断 的 CPU 百分比。 

%idle: 表示 CPU 的 空闲 时 间 。 

%intrs: 表示 每 秒 CPU 接 收 的 中 断 总 数 。 

用 mpstat 监 控 每 个 虚拟 处 理 器 的 CPU 使 用 率 ， 有 助 于 发 现 应 用 中 是 
一 些 线程 比 其 他 线程 消耗 了 更 多 的 CPU 周期 ， 还 是 应 用 的 所 有 线程 基 
本 平分 CPU 周期 。 如 果 是 后 者 ， 意 味 着 应 用 的 扩展 性 比较 好 。 

mpstat 命 令 和 vmstat 之 间 存 在 一 定 的 区 别 ，mpstat 可 以 显示 每 个 处 
理 器 的 统计 ， 而 vmstat 显 示 所 有 处 理 器 的 统计 。 因 此 ， 编 写 糟 焙 的 应 用 
程序 (不 使 用 多 线程 体系 结构 ) 可 能 会 运行 在 一 个 多 处 理 器 机 器 上 ， 
而 不 使 用 所 有 处 理 器 。 从 而 导致 一 个 CPU 过 载 ， 而 其 他 CPU 却 很 空 
闲 。 通 过 mpstat 可 以 轻松 诊断 这 些 类 型 的 问题 。 

总 的 来 说 ，mpstat 命 令 还 产生 与 CPU 有 关 的 统计 信息 ， 因 此 所 有 和 与 
CPU 问题 有 关 的 讨论 也 都 适用 于 mpstat。 当 看 到 较 低 的 %idle 数 字 时 , 
就 知道 出 现 了 CPU 不 足 的 问题 。 当 看 到 较 高 的 %iowait 数 字 时 ， 就 可 以 
知道 在 当前 负载 下 WO 子 系统 出 现 了 某 些 问题 。 该 信息 对 于 解决 Oracle 
等 关系 型 数据 库 的 性 能 问题 时 非常 有 效 。 

pidstat 

除 CPU 使 用 率 之 外 ， 监 控 CPU 调 度 程 序 运行 队列 对 于 分 辩 系 统 是 
否 满 负 答 也 有 重要 意义 。 运 行 队列 中 就 是 那些 已 准备 好 运行 、 正 等 待 
可 用 CPU 的 轻 量 级 进程 。 如 果 准 备 运 行 的 轻 量 级 进程 数 超过 系统 所 能 
处 理 的 上 限 ， 运 行 队列 就 会 很 长 。 运 行 队 列 很 长 表明 系统 负载 可 能 
饱和 。 系 统 运行 队列 长 度 等 于 虚拟 处 理 器 的 个 数 时 ， 用 户 不 会 明显 感 
觉 到 性 能 下 降 。 此 处 虚拟 处 理 器 的 个 数 就 是 使 用 硬件 线程 的 个 数 ， 也 
就 是 Java API Runtime.availableProcessors () 的 返回 值 。 当 运行 队列 长 
度 达到 虚拟 处 理 的 4 倍 或 更 多 时 ， 系 统 的 响应 就 非常 迟缓 了 。 

一 般 如 果 在 很 长 一 段 时 间 里 ， 运 行 队列 的 长 度 一 直 都 超过 虚拟 处 
理 器 个 数 的 1 倍 左右 需要 关注 了 ， 只 是 暂时 还 不 需要 立即 采取 行动 。 如 
果 在 很 长 一 段 时 间 里 ， 运 行 队 列 的 长 度 达 到 虚拟 处 理 器 个 数 的 3 一 4 倍 
或 更 高 ， 则 需要 立刻 引起 注意 或 采取 行动 。 

解决 运行 队列 较 长 的 问题 普遍 使 用 两 种 方法 。 一 种 是 增加 CPU 以 
分 担负 载 或 减 小 处 理 器 的 负载 量 ， 这 种 方法 从 根本 上 减少 了 每 个 虚拟 


处 理 器 上 的 活动 线程 数 ， 从 而 减少 了 运行 队列 中 的 轻 量 级 进程 数 。 另 
一 种 方法 是 分 析 系 统 中 运行 的 应 用 ， 改 进 CPU 使 用 率 。 换 句 话说 ， 研 
究 可 以 减少 应 用 运行 所 需 CPU 周 期 的 方法 ， 如 减少 垃圾 收集 的 频率 或 
采用 完成 同样 任务 但 CPU 指令 更 少 的 算法 。 性 能 专家 在 减少 代码 路 径 
长 度 以 及 为 了 改进 CPU 指令 选择 性 时 ， 通 常会 考虑 这 种 方法 ，Java 程 序 
员 可 以 通过 更 有 效 的 算法 和 数据 结构 来 实现 更 好 的 性 能 。 这 是 因为 ， 
虽然 现代 JIT 编 译 器 可 以 产生 成 熟 优化 的 代码 以 改善 应 用 性 能 ， 但 Java 
程序 员 几 乎 无 法 操纵 JIT 编 译 器 ， 所 以 应 该 关注 算法 和 数据 结构 的 效 
率 ， 通 过 性 能 分 析 可 以 找 出 哪些 算法 和 数据 结构 值得 关注 。 

可 以 采用 pidstat 工 具 来 检测 CPU 使 用 ， 该 工具 可 以 具体 找 出 占用 
CPU 的 线程 ， 如 图 6-10 所 示 。 其 中 使 用 的 -t 参 数 将 系统 性 能 的 监控 细 化 
到 线程 级 别 。 


[root@racenode4 ~j# pidstat -p 8879 1 3 -u -t 
Linux 2.6. 32-220. e16.x86_64 (facenode4) 


sr %system 
00 


下 面 这 些 是 输出 的 解释 。 


minflt/s: 每 秒 次 缺 页 错误 次 数 (minor page faults) ， 次 缺 页 错误 
次 数 意 即 虚拟 内 存 地 址 映射 成 物理 内 存 地 址 产生 的 page fault 次 数 ; 

majflt/s: 每 秒 主 缺 页 错误 次 数 (major page faults) ， 当 虚拟 内 存 
地 址 映射 成 物理 内 存 地 址 时 ， 相 应 的 page 在 swap 中 ， 这 样 的 page fault 
为 major page fault， 一 般 在 内 存 使 用 紧张 时 产生 ; 

VSZ: 该 进程 使 用 的 虚拟 内 存 〈 以 KB 为 单位 ) ; 

RSS: 该 进程 使 用 的 物理 内 存 (以 KB 为 单位 ) ; 

%MEM: 该 进程 使 用 内 存 的 百分比 ; 

Command: 拉 起 进程 对 应 的 命令 。 

图 6-11 显 示 线 程 17185 占 用 了 18.33% 的 CPU 资 源 。 


平均 时 间 : TGID TID XUSF %system guest %CPU CPU Command 
平均 时 间 : 17157 - 29.00 26.00 0.00 55.00 - java 

平均 时 间 : - 17157 0.00 0. 00 0.00 0. 00 - ] java 
平均 时 间 : - 17158 0.00 0.00 0.00 0. 00 - |. java 
平均 时 间 - 17159 0.00 0.00 0.00 0.00 - |. java 
平均 时 间 - 17160 0.00 0. 00 0.00 0. 00 - | java 
3EiSB [s] - 17161 0.00 0. 00 0.00 0. 00 - |—Jjava 
平均 时 间 - 17162 0.00 0. 00 0.00 0. 00 - |_Java 
平均 时 间 - 17163 0.00 0. 00 0.00 0. 00 - |— Java 
平均 时 间 - 17164 0.00 0.00 0.00 0.00 - |. java 
平均 时 间 - 17165 0.00 0. 00 0.00 0. 00 - [Java 
平均 时 间 = 17166 0.00 0. 00 0.00 0. 00 = | 一 Java 
平均 时 间 - 17167 0.00 0. 00 0.00 0. 00 - |. java 
平均 时 间 - 17168 0.00 0. 00 0.00 0. 00 - |. java 
平均 时 间 - 17169 0.00 0.00 0.00 0. 00 - | java 
FEES GT [s] - 17170 0.00 0. 00 0.00 0. 00 - | 一 ]ava 
平均 时 间 - 17171 0.00 0. 00 0.00 0. 00 - | 一 Java 
平均 时 间 - 17172 0.00 0.00 0.00 0. 00 - |_Java 
平均 时 间 - 17173 0.00 0. 00 0.00 0. 00 - |—3java 
平均 时 间 - 17174 0.00 0. 00 0.00 0. 00 - | 一 java 
平均 时 间 17175 0.00 0. 00 0.00 0. 00 - | 一 java 
平均 时 间 - 17176 0.00 0. 00 0.00 0. 00 - | 一 Java 
平均 时 间 - 17177 0.00 0. 00 0.00 0. 00 - |. java 
平均 时 间 - 17178 0.00 0. 00 0.00 0. 00 - |. java 
平均 时 间 17179 0.00 0.00 0.00 0.00 - | Java 
平均 时 间 - 17180 0.00 0. 00 0.00 0. 00 = |—java 
平均 时 间 - 17181 0.00 0.00 0.00 0. 00 - |W Java 
平均 时 间 - 17182 0.00 0.00 0.00 0. 00 = |—3java 
平均 时 间 - 17183 0.00 0. 00 0.00 0. 00 - | java 
平均 时 间 17184 0.00 0.00 0.00 0.00 = | 一 ava 
平均 时 间 - 17185 10.00 8. 33 0.00 18.33 - |W Java 
平均 时 间 - 17186 1.33 1.00 0.00 2.33 - |. java 
平均 时 间 - 17187 1.33 1.33 0.00 2.67 - |.java 
平均 时 间 = 17188 2.33 2.33 0.00 4.67 = | Java 
平均 时 间 - 17189 8.33 £433 0.00 15.67 - | 一 java 
平均 时 间 - 17190 3.33 2.33 0.00 5.67 - |. java 
平 询 时 间 - 17191 2.33 3. 00 0.00 5. 33 - | 一 java 
平均 时 间 B 17192 0. 67 1.00 0.00 1.67 - | 一 java 


图 6-11 线程 17185 


-d 参 数 表 明 监 控 对 象 为 磁盘 IO。 增 加 了 -d 参 效 后 命令 输出 如 下 所 
示 。 


代码 清单 6-7 pidstat -d 运行 输出 
[root@facenode4 ~]# pidstat -p 17685 -d -t 1 3 


Linux 2.6.32-220.e16.x86 64 (facenode4) 2015401 J 28 A x86 64. (24 CPU) 
11 8 412: 39 # TGID TID kB rd/s kB wr/s kB ccwr/s Command 

118 41440 17685 s 0.00 56.00 0.00 java 

11 BY 414 40 8 - 17685 0.00 0.00 0.00 | java 

118 414 40 8 - . 17686 0.00 0.00 0.00 | java 

118 414 408 = 17687 0.00 0.00 0.00 | java 

11 BY 414 408 a 17688 0.00 0.00 0.00 | java 


11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 
11 时 41 


分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 # 
d 408 
4 408 
4 409 
4408 
4 409 
4 40 
4 409 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 
4 40 
4408 
d 408 
d 408 
d 408 
d 40 
4 408 
4 408 
4 408 
4 408 
分 40 秒 
分 40 秒 
分 40 秒 
分 40 秒 


17689 
17690 
17691 
17692 
17693 
17694 
17695 
17696 
17697 
17698 
17699 
17700 
17701 
17702 
17703 
17704 
17705 
17706 
17707 
17708 
17709 
17710 
17711 
17712 
17713 
17714 
17715 
17716 
17717 
17718 
17719 
17720 
17721 
17722 


D C» €» C» C» C» oc c» C) OGO CO C» CD occa ca «C» co oo COD D vC Co) C» CM Cy» X» X» Co cC» 2 CO => & 


.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 


cn 
a 


€ c» oa O O oc c c» c» 


Qa €» O X» C» x X (CX sa 2 C38 CD «€ cC oo oo SC «— cC» c» c3 c oc c» 


c» c c» c C c c c c c c» c c c» c c c c c c c c» c c» c c c c [mj c c c» c c» 
. . . . . . . . . = . . . . . . . . . . . . . . . . . . . . . . . . 


00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 
00 | java 


从 上 面 的 输出 可 以 看 到 ， 线 程 17713 每 秒 产生 了 大 量 的 磁盘 IO。 
-I 参数 可 以 监控 内 存 使 用 情况 ， 增 加 了 -r 参 数 后 的 输出 如 清单 6-8 所 
o 


代码 清单 6-8 pidstat 增加 -参数 运行 输出 
[root@facenode4 ~]# pidstat -p 17685 -r -t 1 3 
Linux 2.6.32-220.e16.x86 64 (facenode4) 2015 年 01 月 28 日 x86 64 (24 CPU) 


118 442: 13 TGID TID minflt/s majflt/s VSZ RSS $MEM Command 
118 4421497 X 17685 - 0.00 0.00 10984544 45616 0.14 java 
118 44414 f) - 17685 0.00 0.0010984544 45616 0.14 | java 
118 442714 # - 17686 0.00 0.0010984544 45616 0.14 | java 
118] 442 14 £ - 17687 0.00 0.0010984544 45616 0.14 | java 
118 4427 14 # - 17688 0.00 0.0010984544 45616 0.14 | java 


118 442: 14 £j 
118 44214 
118 442 14 € 
118 442149 
118 449148 
118 44 14 £ 
118 442 14 $ 
118 442 14 f 
118 442 14 € 
118 442 14 
118 44214 
118 442714 
118 44214 £j 
118 442714 $ 
118 442 14 
118 442: 14$ 
118 442: 14 f 
118 442714 € 
118 442 14 £ 
118 44214 £ 
118 442 14 £j 
118 442 14 f 
118 442714 8 
118 442714 € 
11H 442 14 £j 
118 442 14 € 
118 44214 £ 
118 442 14 f 
118 44214 £ 
118 442714 £j 
118 442714 
118 44214 £ 
118 442714 £ 
11H 442: 14 £ 


17689 
17690 
17691 
17692 
17693 
17694 
17695 
17696 
17697 
17698 
17699 
17700 
17701 
17702 
17703 
17704 
17705 
17706 
17707 
17708 
17709 
17710 
17711 
17712 
17713 
17714 
17715 
17716 
17717 
17718 
17719 
17720 
17721 
17722 


CO «€ TV O O XC C» "C» «5» O D Ot Cc» C. G O «oO (OQ CX C» CX O «XO,» C" CX Ci CQ C € €) €» cC 


.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 
.00 


c €» cs O O C» CX € C O O co 0» Sc CQ) xD O '(. CO c C CO Co, C)? CO (c & uc C DC) c «€» 


.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.0010984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 
.00 10984544 


45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 
45616 


© c c» c c» c c» c ce c» c» c c» O c c c c» c ce c co c c» c E c CX c» c c» ce c c» 
H . H - . . . . - . . . . - . . . H . - - . . . . . . . . . . . . . 


| java 
| java 
| java 
. java 
. java 
. java 
| java 
. java 
. java 
. java 
. java 
. java 
| java 
. java 
_ java 
. java 
. java 
. java 
. java 
. java 
. java 
. java 
. java 
. java 
. javà 
| java 
. java 
| java 
. java 
. java 
| java 
. java 
| java 


. java 


jstack 命 令 
如 果 需 要 查看 具体 哪个 类 造成 的 CPU 资 源 消耗 较 大 ， 可 以 通过 
jstack-] pid 命 令 找到 它们 。jstack 命 令 执行 的 输出 结果 如 清单 6-9 所 示 。 


代码 清单 6-9 jstack 命令 执行 结果 
[root@facenode4 zhoumingyao]# cat log.txt 
2015-01-28 11:15:13 
Full thread dump Java HotSpot (TM) 64-Bit Server VM (20.45-b01 mixed mode): 


"Attach Listener" daemon prio-10 tid=0x00007fde20001000 nid=0x438d waiting on 
condition [0x0000000000000000] 


java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 


- None 


"DestroyJavaVM" prio-10 tid-0x00007£de7c006800 nid=0x4306 waiting on condition 
[0x0000000000000000] 
java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 
- None 


"Thread-9" prio-10 tid=0x00007fde7c119800 nid=0x432a waiting for monitor entry 
[0x00007£de59037000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println (PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Thread-8" prio-10 tid-0x00007fde7c117800 nid=0x4329 waiting for monitor entry 
[0x00007£de59138000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println (PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Thread-7" prio-10 tid=0x00007fde7c115800 nid=0x4328 waiting for monitor entry 
[0x00007£de59239000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println (PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Thread-6" prio-10 tid=0x00007fde7c113800 nid=0x4327 waiting for monitor entry 
[0x00007£de5933a000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println(PrintStream.java:727) 


- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 
at java.lang.Thread. run (Thread.java: 662) 


Locked ownable synchronizers: 


- None 


"Thread-5" prio-10 tid=0x00007fde7c111800 nid=0x4326 waiting for monitor entry 
[0x00007£de59435000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println(PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMainS$HoldCPUTask.run(HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 


- None 


"Thread-4" prio-10 tid=0x00007fde7c10f800 nid=0x4325 waiting for monitor entry 
[0x00007£de5953c000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println(PrintStream.java:727) 
- waiting to lock «0x000000060b002148» (a java.io.PrintStream) 
at HoldCPUMainSHoldCPUTask.run(HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Thread-3" prio-10 tid=0x00007fde7c10d800 nid=0x4324 waiting for monitor entry 
[0x00007£de59634d000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println(PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMainSHoldCPUTask.run(HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 


- None 


"Thread-2" prio-10 tid=0x00007fde7c10b800 nid=0x4323 runnable [0x00007fde5973e000] 
java.lang.Thread.State: RUNNABLE 

at java.io.FileOutputStream.writeBytes (Native Method) 
at java.io.FileOutputStream.write(FileOutputStream.java:282) 
at 

java.io.BufferedOutputStream.flushBuffer (BufferedOutputStream.java:65) 
at java.io.BufferedOutputStream. flush (BufferedOutputStream. java:123) 
- locked <0x000000060b02c530> (a java.io.BufferedOutputStream) 


at java.io.PrintStream.write (PrintStream.java:432) 

- locked <0x000000060b002148> (a java.io.PrintStream) 

at sun.nio.cs.StreamEncoder.writeBytes (StreamEncoder.java:202) 

at sun.nio.cs.StreamEncoder.implFlushBuffer (StreamEncoder.java:272) 
at sun.nio.cs.StreamEncoder.flushBuffer(StreamEncoder.java:85) 

- locked «0x000000060b00cfa0» (a java.io.OutputStreamWriter) 

at java.io.OutputStreamWriter.flushBuffer(OutputStreamWriter.java:168) 
at java.io.PrintStream.newLine(PrintStream.java:496) 

- locked <0x000000060b002148> (a java.io.PrintStream) 

at java.io.PrintStream.println(PrintStream.java:729) 

- locked <0x000000060b002148> (a java.io.PrintStream) 

at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 

at java.lang.Thread.run (Thread. java: 662) 


Locked ownable synchronizers: 
- None 


"Thread-1" prio-10 tid-0x00007fde7c109800 nid=0x4322 waiting for monitor entry 
[0x00007£de5983£000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println (PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask.run (HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Thread-0" prio-10 tid=0x00007fde7c108000 nid=0x4321 waiting for monitor entry 
[0x00007£de59940000] 
java.lang.Thread.State: BLOCKED (on object monitor) 
at java.io.PrintStream.println(PrintStream.java:727) 
- waiting to lock <0x000000060b002148> (a java.io.PrintStream) 
at HoldCPUMain$HoldCPUTask. run (HoldCPUMain.java:10) 
at java.lang.Thread.run(Thread.java:662) 


Locked ownable synchronizers: 
- None 


"Low Memory Detector" daemon prio-10 tid=0x00007fde7c0d2800 nid=0x431f runnable 
[0x0000000000000000] 
java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 


- None 


"C2 CompilerThreadl" daemon prio-10 tid-0x00007fde7c0d0000 nid=0x43le waiting on 
condition [0x0000000000000000] 


java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 
- None 


"C2 CompilerThread0" daemon prio-10 tid-0x00007f£de7c0cd000 nid-0x431d waiting on 
condition [0x0000000000000000] 


java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 


- None 


"Signal Dispatcher" daemon prio-10 tid-0x00007f£de7c0cb000 nid-0x431c runnable 
[0x0000000000000000] 


java.lang.Thread.State: RUNNABLE 


Locked ownable synchronizers: 
- None 


"Finalizer" daemon prio-10 tid-0x00007fde7c0af000 nid-0x431b in Object.wait() 
[0x00007£de59f46000] 


java.lang.Thread.State: WAITING (on object monitor) 
at java.lang.Object.wait(Native Method) 
- waiting on <0x000000060b002098> (a java.lang.ref.ReferenceQueueSLock) 
at java.lang.ref.ReferenceQueue.remove (ReferenceQueue.java:118) 
- locked <0x000000060b002098> (a java.lang.ref.ReferenceQueue$Lock) 
at java.lang.ref.ReferenceQueue.remove (ReferenceQueue.java:134) 
at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:171) 


Locked ownable synchronizers: 


- None 


"Reference Handler" daemon  prio-10  tid-0x00007fde7c0ad000  nid-0x431a in 
Object.wait() [0x00007£de5a047000] 


java.lang.Thread.State: WAITING (on object monitor) 
at java.lang.Object.wait(Native Method) 
- waiting on <0x000000060b002138> (a java.lang.ref.Reference$Lock) 
at java.lang.Object.wait(Object.java:485) 
at java.lang.ref.Reference$ReferenceHandler.run (Reference.java:116) 
- locked <0x000000060b002138> (a java.lang.ref.Reference$Lock) 


Locked ownable synchronizers: 


- None 
"VM Thread" prio-10 tid-0x00007fde7c0a6000 nid=0x4319 runnable 


"GC task thread#0 (ParallelGC)" prio-10 tid=0x00007fde7c019800 nid=0x4307 runnable 


"GC task thread#1 (ParallelGC)" prio-10 tid=0x00007fde7c01b000 nid=0x4308 runnable 


"GC task thread#2 (ParallelGC)" prio-10 tid=0x00007fde7c01d000 nid=0x4309 runnable 


"GC task thread#3 (ParallelGC)" prio-10 tid=0x00007fde7c01£000 nid=0x430a runnable 


"GC task thread#4 (ParallelGC)" prio-10 tid=0x00007fde7c020800 nid=0x430b runnable 


"GC task thread#5 (ParallelGC)" prio-10 tid=0x00007fde7c022800 nid=0x430c runnable 


"GC task thread#6 (ParallelGC)" prio-10 tid=0x00007fde7c024800 nid=0x430d runnable 


"GC task thread#7 (ParallelGC)" prio=10 tid=0x00007fde7c026000 nid=0x430e runnable 


"GC task thread#8 (ParallelGC)" prio-10 tid=0x00007fde7c028000 nid=0x430f runnable 


"GC task thread#9 (ParallelGC)" prio-10 tid=0x00007fde7c02a000 nid=0x4310 runnable 


"GC task thread#10 (ParallelGC)" 


"GC task thread#11 (ParallelGC)" 


"GC task thread#12 (ParallelGC)" 


"GC task thread#13 (ParallelGC)" 


"GC task thread#14 (ParallelGC)" 


"GC task thread#15 (ParallelGC)" 


"GC task thread#16 (ParallelGC)" 


"GC task thread#17 (ParallelGC)" 


prio-10 tid=0x00007fde7c02b800 nid=0x4311 


prio=10 tid=0x00007fde7c02d800 nid=0x4312 


prio-10 tid-0x00007fde7c02f800 nid=0x4313 


prio-10 tid=0x00007fde7c031000 nid=0x4314 


prio=10 tid-0x00007fde7c033000 nid=0x4315 


prio-10 tid-0x00007fde7c035000 nid=0x4316 


prio-10 tid=0x00007fde7c036800 nid=0x4317 


prio-10 tid=0x00007fde7c038800 nid=0x4318 


runnable 


runnable 


runnable 


runnable 


runnable 


runnable 


runnable 


runnable 


"VM Periodic Task Thread" prio-10 tid=0x00007fde7c0e5000 nid=0x4320 waiting on 


condition 


JNI global references: 969 


从 上 面 输出 可 以 看 到 ， 观 察 的 应 用 程序 是 一 个 多 线程 程序 ， 其 中 
有 一 个 线程 (Thread-2) 正在 运行 程序 。 

综合 上 面 所 有 描述 的 工作 使 用 及 输出 情况 ， 我 们 知道 实际 程序 运 
行 过 程 中 ， 我 们 可 以 总 结 出 来 ， 一 般 来 说 ， 如 果 CPU 时 钟 周期 被 用 于 
执行 操作 系统 或 内 核 代 码 ， 这 部 分 时 钟 周期 就 无 法 用 于 执行 应 用 程 
序 。 因 此 ， 改 善 应 用 程序 性 能 的 策略 之 一 是 减少 消耗 在 系统 或 内 核 
CPU 上 的 时 钟 周期 数 。 但 是 ， 这 一 策略 不 适用 于 在 系统 或 内 核 态 上 消 
耗 时 间 极 少 的 应 用 程序 。 监 控 操 作 系 统 在 系统 或 内 核 态 上 CPU 的 使 用 
情况 能 够 为 决策 是 否 采用 该 策略 提供 依据 。 此 外 ， 待 运行 线程 在 处 理 
器 之 间 的 迁移 也 会 导致 性 能 下 降 。 大 多 数 操作 系统 的 CPU 调 度 程序 会 
将 待 运行 线程 分 配给 上 次 运行 它 的 虚拟 处 理 器 。 如 果 这 个 虚拟 处 理 器 
忙 ， 调 度 程序 就 会 将 待 运行 线程 迁移 到 其 他 可 用 的 虚拟 处 理 器 。 线 程 
迁移 会 对 应 用 性 能 造成 影响 ， 这 是 因为 新 的 虚拟 处 理 器 缓存 中 可 能 没 
有 待 运行 线程 所 需 的 数据 或 状态 信息 。 多 核 系统 上 运行 Java 应 用 可 能 会 
产生 大 量 的 线程 迁移 ， 减 少 迁移 的 策略 是 创建 处 理 器 组 并 将 Java 应 用 分 
配给 这 些 处 理 器 组 。 一 般 性 准则 是 ， 如 果 横 跨 多 核 或 虚拟 处 理 器 的 Java 
应 用 每 秒 迁 移 超 过 500 次 ， 将 Java 应 用 绑 定 在 处 理 器 上 有 益处 。 


6.1.2 监控 内 存 


除了 CPU 使 用 率 ， 还 需要 监控 系统 内 存 相 关 的 属性 ， 例 如 页 面 调 
度 或 页 面 交 换 、 加 锁 、 线 程 迁 移 中 的 让 步 式 和 抢占 式 上 下 文 切 换 。 

系统 在 进行 页 面 交 换 或 使 用 虚拟 内 存 时 ，Java 应 用 或 JVM 会 表现 出 
明显 的 性 能 问题 。 当 应 用 运行 所 需 的 内 存 超过 可 用 物理 内 存 时 ， 就 会 
发 生 页 面 交 换 。 为 了 应 对 这 种 可 能 出 现 的 情况 ， 通 党 要 为 系统 配置 
swap 空 间 。swap 空 间 一 般 会 在 一 个 独立 的 磁盘 分 区 上 。 当 应 用 耗 尽 物 
理 内 存 时 ， 操 作 系 统 会 将 应 用 的 一 部 分 置换 到 磁盘 上 的 swap 空 间 ， 通 
常 是 应 用 中 最 少 运 行 的 部 分 ， 以 免 影响 整个 应 用 或 者 应 用 最 忙 的 那 部 
分 。 当 访问 应 用 中 被 置换 出 去 的 部 分 时 ， 就 必须 将 它 从 磁盘 置换 进 内 
存 ， 而 这 种 置换 活动 会 对 应 用 的 响应 性 和 吞吐 量 造 成 很 大 影响 。 

此 外 ，JVM 垃 圾 收集 器 在 系统 页 面 交 换 时 的 性 能 也 很 差 ， 这 是 由 
于 垃圾 收集 器 为 了 回收 不 可 达 对 象 所 占用 的 空间 ， 需 要 访问 大 量 的 内 
存 。 如 果 Java 堆 的 一 部 分 被 置换 出 去 ， 就 必须 先 置换 进 内 存 以 便 垃圾 收 


集 器 扫描 存活 对 象 ， 这 会 增加 垃圾 收集 的 持续 时 间 。 垃 圾 收集 时 一 种 
Stop-The-World (时 空 停止 ) 操作 ， 即 停止 所 有 正在 运行 的 应 用 线程 ， 
如 果 此 时 系统 正在 进行 页 面 交 换 ， 则 会 引起 JVM 长 时 间 的 停顿 。 如 果 
出 现 垃圾 收集 时 间 变 长 ， 系 统 有 可 能 正在 进行 页 面 交 换 。 为 了 验证 这 
一 点 ， 你 必须 监控 系统 的 页 面 交 换 。 

我 们 本 小 节 的 监控 方式 演示 都 会 按照 windows 篇 和 Linux 篇 ， 其 中 
Windows 针 对 的 是 windows7 操 作 系 统 ，Linux 针 对 的 是 CentosV6.5 操 作 
系统 。 

6.1.2.1 内 存 使 用 率 监控 工具 -windows 篇 

前 面 在 介绍 CPU 监控 的 时 候 ， 提 到 过 Windows 操 作 系 统 上 面 有 一 个 
工具 Perfmon， 同 样 该 工具 也 可 以 被 用 来 监控 内 存 使 用 情况 。 如 表 6-3 所 
示 ， 有 罗列 了 和 内 存 监 控 相 关 的 计数 器 ， 读 者 可 以 自由 添加 ， 有 具体 使 用 
方式 详 见 6.1.1CPU 使 用 率 监控 工具 之 Windows 篇 。 

表 6-3 Perfmon 内 存 监 控 功 能 


性 能 对 象 | 计数 器 提供 的 信息 

Available Bytes Available Bytes 显示 出 当前 空闲 的 物理 内 存 总 量 。 当 这 个 数值 变 
小 时 ，Windows 开始 频繁 地 调用 磁盘 页 面 文 件 。 如 果 这 个 数值 很 
小 ， 例 如 小 于 $ MB， 系 统 会 将 大 部 分 时 间 消 耗 在 操作 页 面 文件 
上 

% Committed Bytes in Use | % Committed Bytes In Use 是 Memory: Committed Bytes 与 


Memory: Commit Limit 之 间 的 比值 (Committed memory 指 如 果 
需要 写 入 磁盘 时 已 在 分 页 文件 中 保留 空间 的 处 于 使 用 中 的 物理 
内 存 。Commit Limit 是 由 分 页 文件 的 大 小 而 决定 的 。 如 有 果 扩大 了 
分 页 文件 ， 该 比例 就 会 减 小 )。 这 个 计数 器 只 显示 当前 百分比 
而 不 是 一 个 平均 人 


性 能 对 象 | 计数 器 提供 的 信息 

Page Faults/sec Page Faults/sec 是 指 处 理 器 处 理 错误 页 的 综合 速率 。 用 错误 页 数 / 
秒 来 计算 。 当 处 理 器 请 求 一 个 不 在 其 工作 集 (在 物理 内 存 中 的 空 
间 ) 内 的 代码 或 数据 时 出 现 的 页 错误 ,这 个 计数 器 包括 人 硬 错误 ( 屠 


些 需要 磁盘 访问 的 ) 和 软 错误 (在 物理 内 存 的 其 他 地 方 找到 的 错 
误 页 )。 许 多 处 理 器 可 以 在 有 大 量 软 错误 的 情况 下 继续 操作 。 但 
fey 便 错误 可 以 导致 明显 的 拖延 。 这 个 计数 器 显示 用 上 两 个 实例 
中 观察 到 的 值 之 间 的 差 除 以 实例 间隔 的 持续 时 间 所 得 的 值 


Perfmon 工 具 监 控 每 秒 内 存 页 面 调 度 (\Memory\Pages/Second) 、 
可 用 内 存 字 节 数 (Memory\Available MBytes) ， 可 以 判别 系统 是 否 正 
在 进行 页 面 交 换 。 当 可 用 内 人 存 变 少 ， 并 且 有 页 面 调度 时 ， 系 统 可 能 
在 进行 页 面 交 换 。 

显示 Windows 页 面 交 换 的 最 简单 方式 是 typeperf 命 令 。 下 面 的 
typeperf 表 示 每 间隔 5 秒 输出 可 用 内 存 和 页 面 调 度 〈-si 指 定 报 告 间隔 ) o 

typeperf -si 5 ~ \Memory\Available Mbytes * í 
\Memory\Pages/sec” 


6.1.2.2 内 存 使 用 率 监控 工具 一 Linux 篇 

在 做 Linux 系 统 优化 的 时 候 ， 物 理 内 存 是 其 中 最 重要 的 一 方面 。 自 
然 Linux 也 提供 了 非常 多 的 方法 来 监控 宝贵 的 内 存 资源 使 用 情况 。 下 面 
各 项 命令 逐一 列 出 了 Linux 系 统 下 通过 视图 工具 或 命令 行 来 查看 内 存 使 
用 情况 的 各 种 方法 。 

free 命 令 

free 命 令 是 一 个 快速 查看 内 存 使 用 情况 的 方法 ， 它 是 
对 /procmeminfo 收 集 到 的 信息 的 一 个 概述 。 运 行 free 命 令 ， 输 出 内 容 如 
下 所 示 。 


代码 清单 6-10 free 命令 
[root@nodel:1 zhoumingyao]# free 
total used free shared buffers cached 
Mem: 32830232 23849720 8980512 6816 346804 17367556 
-/+ buffers/cache: 6135360 26694872 
Swap: 8191996 543048 7648948 


各 输出 列 的 解释 如 下 所 示 。 

total: 总 计 物 理 内 存 的 大 小 ; 
used: 已 使 用 多 大 ; 

free: ARAB); 

Shared: 多 个 进程 共享 的 内 存 总 额 ; 
Buffers/cached: 磁盘 缓存 的 大 小 ; 


4 — f, 


第 三 行 (-/+buffers/cached) : 

used: 已 使 用 多 大 ; 

free: DRAB, 

第 二 行 (mem) 的 used/free 与 第 三 行 (-/+buffers/cache) used/free 存 
在 区 别 。 这 两 个 输出 的 区 别 在 于 从 使 用 的 角度 来 看 ， 第 一 行 是 从 操作 
系统 的 角度 来 看 ， 因 为 对 于 操作 系统 而 言 ，buffers/cached 都 是 属于 被 使 
用 的 ， 所 以 可 用 内 存 是 16176KB， 已 用 内 存 是 3250004KB， 其 中 包括 ， 
内 核 (操作 系统 ) 使 用 +Application (X, oracle, etc) 使 用 的 
+bufferstcached。 第 三 行 所 指 的 是 从 应 用 程序 角度 来 看 ， 对 于 应 用 程序 
来 说 ，buffers/cached 是 等 于 可 用 的 内 存 ， 因 为 buffer/cached 是 为 了 提高 
文件 读 取 的 性 能 ， 当 应 用 程序 需 在 用 到 内 存 的 时 候 ，buffer/cached 会 很 
快 地 被 回收 。 所 以 从 应 用 程序 的 角度 来 说 ， 可 用 内 存 = 系 统 free 


memory+buffers+cached。 

/proc/meminfo 

Linux 系 统 上 的 /proc 目 录 是 一 种 文件 系统 ， 即 proc 文 件 系 统 。 与 其 
他 常见 的 文件 系统 不 同 的 是 ，/proc 是 一 种 伪 文 件 系统 〈 即 虚拟 文件 系 
Zt) ， 存 储 的 是 当前 内 核 运行 状态 的 一 系列 特殊 文件 ， 用 户 可 以 通过 


这 些 文件 查看 有 关系 统 硬件 及 当前 正在 运行 进程 的 信息 ， 甚 至 可 以 通 
过 更 改 其 中 某 些 文件 来 改变 内 核 的 运行 状态 。 基 于 /proc 文 件 系 统 如 上 
所 述 的 特殊 性 ， 其 内 的 文件 也 常 被 称 作 虚拟 文件 ， 并 具有 一 些 独特 的 
特点 。 例 如 ， 其 中 有 些 文件 虽然 使 用 查看 命令 查看 时 会 返回 大 量 信 
息 ， 但 文件 本 身 的 大 小 却 会 显示 为 0 字 节 。 上 此外， 这 些 特殊 文件 中 大 多 
数 文 件 的 时 间 及 日 期 属性 通常 为 当前 系统 时 间 和 日 期 ， 这 跟 它 们 随时 
会 被 刷新 (存储 于 RAM 中 ) 有 关 。 为 了 查看 及 使 用 上 的 方便 ， 这 些 文 
件 通常 会 按照 相关 性 进行 分 类 存储 于 不 同 的 目录 甚至 子 目录 中 ， 
如 /proc/scsi 目 录 中 存储 的 就 是 当前 系统 上 所 有 SCSI 设 备 的 相关 信 
息 ，/procN 中 存储 的 则 是 系统 当前 正在 运行 的 进程 的 相关 信息 ， 其 中 N 
为 正在 运行 的 进程 〈 可 以 想象 得 到 ， 在 某 进 程 结 束 后 其 相关 目录 则 会 
消失 ) 。 

查看 内 存 使 用 情况 最 简单 的 方法 是 通过 /procmeminfo， 这 个 动态 
更 新 的 虚拟 文件 实际 上 是 许多 其 他 内 存 相 关 工 具 〈 如 : free/ps/tp) 等 
的 组 合 显示 。Aprocmeminfo 列 出 了 所 有 你 想 了 解 的 内 存 的 使 用 情况 。 


代码 清单 6-11 查看 meminfo 


[root@nodel:1 zhoumingyao]# cat /proc/meminfo 


MemTotal: 32830232 kB 
MemF ree: 7727192 kB 
Buffers: 346620 kB 
Cached: 17367504 kB 
SwapCached: 153312 kB 
Active: 8054688 kB 
Inactive: 16041548 kB 


Active(anon): 5834084 kB 
Inactive(anon): 554848 kB 
Active(file): 2220604 kB 
Inactive (file): 15486700 kB 


Unevictable: 0 kB 
Mlocked: 0 kB 
SwapTotal: 8191996 kB 
SwapFree: 7648948 kB 
Dirty: 160 kB 
Writeback: 0 kB 


AnonPages: 6271868 kB 


Mapped: 
Shmem: 
Slab: 


SReclaimable: 


SUnreclaim: 
KernelStack: 
PageTables: 


NFS Unstable: 


Bounce: 


WritebackTmp: 


CommitLimit: 


Committed AS: 
VmallocTotal: 


VmallocUsed: 


VmallocChunk: 


115688 kB 
6816 kB 
671440 kB 
604084 kB 
67356 kB 
10936 kB 
77952 kB 
0 kB 
0 kB 
0 kB 
24607112 kB 
12565524 kB 
34359738367 
337008 kB 
34342462520 


HardwareCorrupted: 0 kB 


AnonHugePages: 

HugePages Total: 
HugePages Free: 
HugePages Rsvd: 
HugePages Surp: 


Hugepagesize: 


DirectMap4k: 
DirectMap2M: 


9605376 kB 
0 
0 
0 
0 
2048 kB 
5056 kB 
2045952 kB 


i : 31457280 kB 


f; 


DirectMaplG 


一 解释 清单 中 的 字段 所 代表 的 意义 
MemTotal : 


MemFree : 


Buffers: FH3kEZ 


所 有 可 用 RAM 大 小 ( 即 物 理 内 存 减 去 一 些 预 留 位 和 内 
核 的 二 进 制 代码 大 小 ) 


LowFree 与 HighFree 的 总 和 ， 被 系 


全 文件 做 缓冲 大 小 ; 


统 留 


着 未 使 用 的 内 


Cached: 被 高 速 缓冲 存储 器 (cache memory) 用 的 内 存 的 大 小 (等 


了 于 diskcache minus SwapCache) ; 

SwapCached: 被 高 速 缓冲 存储 器 (cache memory) 用 的 交换 空间 
的 大 小 ， 已 经 被 交换 出 来 的 内 存 ， 但 仍然 被 存放 在 swapfile 中 。 用 来 在 
需要 的 时 候 很 快 被 替换 而 不 需要 再 次 打开 IO 端口 。 

Active: 在 活跃 使 用 中 的 缓冲 或 高 速 缓冲 存储 器 页 面 文件 的 大 小 ， 
除非 非常 必要 否则 不 会 被 移 作 他 用 ; 

Inactive: 在 不 经 常 使 用 中 的 缓冲 或 高 速 缓冲 存储 器 页 面 文件 的 大 
小 ， 可 能 被 用 于 其 他 途径 ; 

HighFree: 该 区 域 不 是 直接 映射 到 内 核 空 间 。 内 核 必须 使 用 不 同 的 
手法 使 用 该 段 内 存 ; 

LowFree: 低位 可 以 达到 高 位 内 存 一 样 的 作用 ， 而 且 它 还 能 够 被 内 
核 用 来 记录 一 些 自己 的 数据 结构 。 

SwapTota: 交换 空间 的 总 大 小 ; 

SwapFree: 未 被 使 用 交换 空间 的 大 小 ; 

Dirty: 等 待 被 写 回 到 磁盘 的 内 存 大 小 ; 

Writeback: 正在 被 写 回 到 磁盘 的 内 存 大 小 ; 

AnonPages: 未 映射 页 的 内 存 大 小 ; 

Mapped: 设备 和 文件 等 映射 的 大 小 ; 

Slab: 内 核 数据 结构 缓存 的 大 小 ， 可 以 减少 申请 和 释放 内 存 带 来 的 
消耗 ; 

SReclaimable: 可 收回 Slab 的 大 小 ; 

SUnreclaim  : 不 可 g E Sab A X 小 
(SUnreclaim*SReclaimable-Slab) ; 

PageTables: 管理 内 存 分 页 页 面 的 索引 表 的 大 小 ; 

NFS_Unstable: 不 稳定 页 表 的 大 小 。 

JMap 方 式 

JMap 是 一 个 可 以 输出 所 有 内 存 中 对 象 的 工具 ， 甚 至 可 以 将 VM 中 的 
heap， 以 二 进 制 数 输出 成 文本 。 使 用 命令 SHELL jmap-histo pid > a.log 
可 以 将 输出 重 定向 并 保存 到 文本 文件 中 去 (Windows 下 也 可 以 使 用 ) ， 


相应 地 ， 可 以 使 用 文本 对 比 工具 可 以 打开 盖 文 件 ， 并 碍 看 GC 回 收 了 哪 
些 对 象 。 


代码 清单 6-12 JMap 命令 输出 
[root@nodel:10 zhoumingyao]# jmap -histo 19940 


num #instances bytes class name 

1 1177 74434696 [I 

2 10357 22517920 [B 

3 2875 240312 [C 

4; 1828 124976 [Ljava.lang.Object; 

5t 519 59288 java.lang.Class 

6 2324 55776 java.lang.String 

7 1344 53760 java.lang.ref.Finalizer 

8 1377 44064 java.io.File 

9: 1327 42464 java.io.FileDescriptor 

10: 1521 24336 java.lang.Object 

1i 664 21248 java.io.FileInputStream 
12: 663 21216 java.io.FileOutputStream 
13: 640 20480 java.util.Vector 

14: 45 16920 java.lang.Thread 

18: 661 10576 java.io.FileOutputStream$1 
16: 125 9000 java.lang.reflect.Field 
Las 102 8624 [Ljava.lang.String; 

18: 257 8224 java.util.HashMap$Node 

19: 20 5312 [Ljava.util.HashMap$Node; 
20: 128 5120 java.lang.ref.SoftReference 
pin 258 4128 java.lang. Integer 

22: 114 3648 java.util.HashtableSEntry 
231 151 3624 java.lang.StringBuilder 
24: 81 2592 java.util.concurrent.ConcurrentHashMap$Node 


é91 5 2408 [J 


26: 29 2320 [Ljava.lang.ThreadLocal$ThreadLocalMapSEntry; 
21i 18 2144 [Ljava.util.Hashtable$SEntry; 

28: 49 1960 java.security.AccessControlContext 

291 33 1848 sun.nio.cs.UTF 8$Encoder 

30: 38 1824 sun.util.locale.Locale0bjectCache$CacheEntry 
3f 1 1544 [[B 

321 23 1472 java.net.URL 

333 25 1200 3java.util.HashMap 

34: 14 1120 java.lang.reflect.Constructor 


一 个 heap dump 是 Java 虚 拟 机 (JVM) 在 某 一 时 刻 所 有 对 象 的 快 
上 照 。JVM 从 堆 中 为 所 有 的 类 实例 和 数组 分 配 内 存 。 当 一 个 对 象 不 再 被 
使 用 并 且 没 有 对 它 的 引用 时 ， 垃 圾 回收 器 回收 其 堆 内 存 。 通 过 查看 
堆 ， 你 可 以 找到 对 象 创建 的 位 置 ， 发 现 对 象 的 引用 。 

下 面 的 命令 可 以 将 19940 进 程 的 内 存 heap 输 出 出 来 到 f1 文 件 里 。 


代码 清单 6-13 jamp 内 存 堆 输出 到 文件 
[root@nodel:10 zhoumingyao]# jmap -dump:format-b,file-f1 19940 
Dumping heap to /home/zhoumingyao/fl ... 
Heap dump file created 


生成 的 f1 文 件 是 一 个 二 进 制 文件 ， 需 要 用 特定 的 工具 才能 打开 。 例 
如 JHat 工 具 ， 如 下 所 示 。 


代码 清单 6-14 JHat 命令 输出 


[root@nodel:1 zhoumingyao]# jhat fl 

Reading from fl... 

Dump file created Tue Sep 15 11:09:56 CST 2015 
Snapshot read, resolving... 

Resolving 29677 objects... 

Chasing references, expect 5 dots..... 
Eliminating duplicate references..... 

Snapshot resolved. 

Started HTTP server on port 7000 


Server is ready. 


以 上 这 些 输出 显示 已 经 打开 了 一 个 HTTP 服务， 端口 号 为 7000， 我 
们 打开 浏览 器 ， 输 入 地 址 : http: /ip: 7000， 然 后 点 击 访问 ， 页 面 如 
图 6-12 所 示 。 


All Classes (excluding platform) 


Package «Default Package? 


Code [0x71909eaf0] 
Code$HoldCPUTask [0x7190a3628] 


r Queries 


(including platform 
udi latfi 


图 6-12 JHat UI1 


我 们 可 以 查看 各 类 信息 ， 比 如 点 击 “All Classes including 
platform”， 可 以 查看 整个 应 用 程序 里 面包 含 的 类 清单 ， 如 图 6-13 所 示 。 


All Classes (including platform) 


Package <Arrays> 


class [B [0x719000558 
class [C LOx719000420 
class LD 
ass LF 
ass LI 
class |] 


n 


class [L java. io.Filej 
ass 


eamField; [0x7190052b0] 

ble; [0x7190041e8] 

e; [0x7190091a8] 
04250] 

luefEntry; [0xT1904cdb0] 

[0x7190532£8] 
parable; [0x719005248] 

Enum; [0x71902bb50] 

Error; [0x719004888] 

Integer; [0x71902cd70] 

Number; [0x71902cd08] 

Nh iec Q Anon 


图 6-13 JHat UI2 

JDK 自 带 的 JHat 命 令 可 以 被 用 来 分 析 java 堆 的 命令 ， 可 以 将 堆 中 的 
对 象 以 html 的 形式 显示 出 来 ， 包 括 对 象 的 数量 、 大 小 等 ， 并 支持 对 象 查 
询 语言 。 如 果 dump 出 来 的 堆 很 大 ， 在 局 动 时 会 报 堆 空间 不 足 的 错误 ， 
可 以 使 用 如 下 参数 ，jhat-J-Xmx512m < heap dump file > o 

除了 JHat 之 外 ， 我 们 也 可 以 使 用 VisualVM 浏 览 heap dump 文 件 的 内 
容 ， 从 而 快速 查看 在 堆 中 分 配 的 对 象 。Heap dumps 在 主 窗口 的 heap 
dump 子 标签 页 中 显示 。 你 可 以 打开 保存 在 本 地 的 heap dump X fF 

(.hprof) 或 者 使 用 VisualVM 捕 获 正在 运行 的 程序 的 heap dumps。 如果 

JVM 试 图 从 堆 中 移 除 不 再 需要 的 对 象 时 失败 了 ，YVisualVM 可 以 定位 到 
离 该 对 象 最 近 的 垃圾 回收 根 (garbage collecting root) o 

第 3 章 中 曾经 讲 到 虚 引 用 的 finalization 过 程 ，JMap 命 令 也 可 以 显示 
有 多 少 对 象 正 在 finalization 队 列 中 ， 等 待 finalizer thread 进 行 finalizer。 
以 下 命令 显示 进程 19940 下 面 有 多 少 个 对 象 在 收集 队列 中 。 


代码 清单 6-15 JMap 输出 队列 信息 
[root@nodel:1 zhoumingyao]# jmap -finalizerinfo 19940 
Attaching to process ID 19940, please wait... 
Debugger attached successfully. 
Server compiler detected. 
JVM version is 25.45-b02 


Number of objects pending for finalization: 0 


JMap 命 令 参数 说 明 : 

1)options: 

executable Java executable from which the core dump was produced. 

(可 能 是 产生 core dump 的 java 可 执行 程序 ) 

core: 将 被 打印 信息 的 core dump 文 件 ; 

remote-hostname-or-IP: 远程 debug 服 务 的 主机 名 或 ip; 

server-id: 唯一 id， 假 如 一 台 主 机 上 多 个 远程 debug 服 务 。 

2) 基本 参数 : 

-dump: [live, ]format-b, file- < filename > ， 使 用 hprof 二 进 制 形 
式 ， 输 出 JVM 的 堆 内 容 到 文件 ，live 子 选项 是 可 选 的 ， 假 如 指定 live 选 
项 ， 那 么 只 输出 活 的 对 象 到 文件 ; 

-finalizerinfo: 打印 正 等 候 回 收 的 对 象 的 信息 ; 

-heap: 打印 heap 的 概要 信息 、GC 使 用 的 算法 、heap 的 配置 及 wise 
heap 的 使 用 情况 ; 

-histo[: live]: 打印 每 个 class 的 实例 数目 、 内 存 占用 、 类 全 名 信 
息 、JVM 的 内 部 类 名 字 开 头 会 加 上 前 级 ”*”，live 子 参数 加 上 后 只 统计 
活 的 对 象 数 量 ，; 

-permstat: 打印 classload 和 jvm heap 长 久 层 的 信息 ， 包 含 每 个 
classloader 的 名 字 、 活 泼 性 、 地 址 、 父 classloader 和 加 载 的 class 数 量 。 另 
外 ， 内 部 String 的 数量 和 占用 内 存 数 也 会 打印 出 来 ; 

-F: 强迫 在 pid 没 有 相应 的 时 候 使 用 -dump 或 者 -histo 参 数 。 在 这 个 
模式 下 live 子 参数 无 效 ; 


-h|-help: 打印 辅助 信息 ; 

J: 传递 参数 给 jmap 启 动 的 jvm。 

如 果 pid 需 要 被 打印 相关 的 信息 ， 最 常用 的 JMap 使 用 方式 是 打印 堆 
内 存 里 面 的 具体 使 用 情况 ， 输 出 如 清单 6-16 所 示 。 


代码 清单 6-16 JMap 输出 堆 内 存 信息 


[root@nodel:1 zhoumingyao]# jmap -heap 19940 


Attaching to process ID 19940, please wait... 
Debugger attached successfully. 

Server compiler detected. 

JVM version is 25.45-b02 

using thread-local object allocation. 
Parallel GC with 18 thread(s) 


Heap Configuration: 


MinHeapFreeRatio = 0 
MaxHeapFreeRatio = 100 
MaxHeapSize = 8405385216 (8016. 0MB) 
NewSize = 175112192 (167.0MB) 
MaxNewSize = 2801795072 (2672.0MB) 
OldSize = 351272960 (335.0MB) 
NewRatio = 2 
SurvivorRatio = 8 
MetaspaceSize = 21807104 (20.796875MB) 
CompressedClassSpaceSize = 1073741824 (1024. 0MB) 
MaxMetaspaceSize = 17592186044415 MB 
GlHeapRegionSize = 0 (0.0MB) 

Heap Usage: 


PS Young Generation 
Eden Space: 
capacity = 132120576 (126.0MB) 


used = 97788272 (93.25816345214844MB) 


free = 34332304 (32.74183654785156MB) 
74.01441543821305$ used 
From Space: 
capacity = 21495808 (20.5MB) 
used = 0 (0.0MB) 
free = 21495808 (20.5MB) 
0.0$ used 
To Space: 
capacity - 21495808 (20.5MB) 
used = 0 (0.0MB) 
free = 21495808 (20.5MB) 
0.0% used 


PS Old Generation 
capacity = 351272960 (335.0MB) 


used = 0 (0.0MB) 
free = 351272960 (335. 0MB) 
0.0% used 


854 interned Strings occupying 55992 bytes. 


LA Esai tT EN SIVMS FEA NEB. MERREERN 
配置 情况 等 ， 具 体 概 念 性 知识 会 在 第 7 章 详细 解释 。 

atop 

这 是 一 款 用 于 监控 Linux 系 统 资 源 与 进程 的 工具 ， 它 以 一 定 的 频率 
记录 系统 的 运行 状态 ， 所 采集 的 数据 包含 系统 资源 (CPU、 内 存 、 磁 
盘 和 网 络 ) 使 用 情况 和 进程 运行 情况 ， 并 能 以 日 志文 件 的 方式 保存 在 
磁盘 中 ， 服 务 器 出 现 问 题 后 ， 我 们 可 获取 相应 的 atop 日 志文 件 进行 分 
析 ， 如 图 6-14 所 示 。atop 是 一 款 开 源 软 件 ， 我 们 可 以 从 
http: /www.atoptool.nldownloadatop.php 获 得 其 源码 和 rpm 安 装 包 。 


ATOP - LX AMALIA Ak 35:38 |  J «=«--- 10m0s elapsed 


"Iu $i 


aan SYSCEY etae VGROW RGROW RDDSK  WRDSK ST EXC S CPU CMD 
n25* ‘ -f -1964K 19660k 24K - R 41% chrome 
OK 


OK 16K 


20K 10436K - 
Ok 
OK 
OK 
OK 


图 6-14 atop 输 出 

ATOP 列 : 该 列 显 示 了 主机 名 、 信 息 采 样 日 期 和 时 间 点 ; 

PRC 列 : 该 列 显 示 进 程 整体 运行 情况 ， 其 中 

(1) sys、usr 字 段 分 别 指示 进程 在 内 核 态 和 用 户 态 的 运行 时 间 

(2) 井 proc 字 段 指 示 进 程 总 数 

(3) ###zombie 字 段 指示 僵 死 进程 的 数量 

(4) 井 exit 字 段 指示 atop 采 样 周期 期 间 退出 的 进程 数量 

CPU 列 : 该 列 显 示 CPU 整 体 〈 即 多 核 CPU 作为 一 个 整体 CPU 资源 ) 
的 使 用 情况 ， 我 们 知道 CPU 可 被 用 于 执行 进程 、 处 理 中 断 ， 也 可 处 于 

空闲 状态 《空闲 状 态 分 两 种 ， 一 种 是 活动 进程 等 待 磁盘 IO 导致 CPU 空 

闲 ， 另 一 种 是 完全 空 闪 ) ， 其 中 

(1) sys、usr 字 段 指 示 CPU 被 用 于 处 理 进程 时 ， 进 程 在 内 核 态 、 
用 户 态 所 占 CPU 的 时 间 比 例 

(2) irq 字 段 指示 CPU 被 用 于 处 理 中 断 的 时 间 比 例 

(3) idle 字 段 指示 CPU 处 在 完全 空闲 状态 的 时 间 比 例 

(4) wait 字 段 指 示 CPU 处 在 “进程 等 待 磁盘 IO 导致 CPU 空闲 ”状态 
的 时 间 比 例 


CPU 列 各 个 字段 指示 值 相 加 结果 为 NO00%， 其 中 N 为 cpu 核 数 。 其 中 

cpu 列 : 该 列 显 示 某 一 核 cpu 的 使 用 情况 ， 各 字段 含义 可 参照 CPU 
列 ， 各 字段 值 相 加 结果 为 100% 

CPL 列 : 该 列 显示 CPU 负载 情况 

(1) avgl、avg5 和 avg15 字 段 : 过 去 1 分 钟 、5 分 钟 和 15 分 钟 内 运行 
队列 中 的 平均 进程 数量 

(2) csw 字 段 指示 上 下 文 交 换 次 数 

(3) intr 字 段 指 示 中 断 发 生 次 数 

MEM 列 : 该 列 指示 内 存 的 使 用 情况 

(1) tot 字 段 指示 物理 内 存 总 量 

(2) free 字 段 指示 空 内 内存 的 大 小 

(3) _ cache 字段 指 示 用 于 页 缓存 的 内 存 大 小 

(4) buff 字 段 指 示 用 于 文件 缓存 的 内 存 大 小 

(5) slab 字 段 指示 系统 内 核 占 用 的 内 存 大 小 

SWP 列 : 该 列 指示 交换 空间 的 使 用 情况 

(1) tot 字 段 指示 交换 区 总 量 

(2) free 字 段 指示 空 内 交换 空间 大 小 

PAG 列 : 该 列 指示 虚拟 内 存 分 页 情况 

swin、swout 字 段 : 换 入 和 换 出 内 存 页 数 

DSK 列 : 该 列 指示 磁盘 使 用 情况 ， 每 一 个 磁盘 设备 对 应 一 列 ， 如 
果 有 sdb 设 备 ， 那 么 增多 一 列 DSK 信 息 

(1) sd FR: 磁盘 设备 标识 

(2) busy 字 段 : 磁盘 忙 时 比例 

(3) read、write 字 段 : 读 、 写 请 求 数量 

NET 列 : 多 列 NET 展 示 了 网 络 状况 ， 包 括 传输 层 (TCP 和 UDP) 、 
IP 层 以 及 各 活动 的 网 口 信息 

(1) XXXi 字 段 指示 各 层 或 活动 网 口 收 包 数目 

(2) XXXo 字 段 指 示 各 层 或 活动 网 口 发 包 数 目 


vmstat 

前 面 介绍 过 ，vmstat 命 令 显 示 实 时 的 和 平均 的 统计 ， 和 覆盖 CPU、 内 
存 、LIO 等 内 容 ， 例 如 内 存 情 况 ， 不 仅 显 示 物 理 内 存 ， 也 统计 虚拟 内 
存 。 

Linux 上 可 以 用 vmstat 输 出 中 的 free 列 监控 页 面 交 换 ， 也 可 以 用 其 他 
方法 例如 top 命 令 或 /provV/meminfo 文 件 来 监控 。 监 控 vmstat 中 的 si 和 so， 
它们 分 别 表示 内 存 页 面 换 入 和 换 出 的 量 。 采 用 vmstat -s 命 令 可 以 打印 出 
内 存 使 用 情况 ， 如 代码 清单 6-17 所 示 。 


代码 清单 6-17 vmstat 打印 内 存 输 出 


[root(nodel:1 
32830232 
26192804 

9182968 
16001608 
6637428 
351692 
17368908 
8191996 
543044 
7648952 
25938502 
3032 
4571919 
5000168909 
255937 


zhoumingyao]# vmstat -s 
total memory 

used memory 

active memory 

inactive memory 

free memory 

buffer memory 

swap cache 

total swap 

used swap 

free swap 

non-nice user cpu ticks 
nice user cpu ticks 
system cpu ticks 

idle cpu ticks 


10-wait cpu ticks 


22 IRQ cpu ticks 


69875 
0 

9335015 
47355696 
257031 
2113723 
1159174941 
1362537573 
1440209401 
6493772 


vmstat 命 令 总 结 了 系统 中 所 有 进程 使 用 的 总 活动 虚拟 内 存 ， 以 及 空 
闲 列 表 上 实 内 存 页 帧 的 数量 。 活 动 的 虚拟 内 存 定义 为 虚拟 内 存 中 实际 


softirq cpu ticks 
stolen cpu ticks 
pages paged in 

pages paged out 
pages swapped in 
pages swapped out 
interrupts 

CPU context switches 
boot time 


forks 


可 以 得 到 的 工作 段 页 面 的 数量 。 这 个 数字 可 能 大 于 机 器 中 的 实际 页 帧 
数 ， 因 为 一 些 活动 的 虚拟 内 存 页 可 能 已 写 出 到 调 页 空间 中 。 

当 确 定 系统 内 存 是 否 短缺 或 者 是 否 需要 进行 某 种 内 存 调 整 时 ， 在 
设 定 的 时 间 间 隔 内 运行 vmstat 命 令 ， 并 检查 结果 报告 中 的 pi 和 po 列 。 这 
两 列表 明了 每 秒 调 页 空间 页 面 调 入 的 数量 和 每 秒 调 页 空间 页 面 调 出 的 
数量 。 如 果 这 些 值 经 常 为 非 零 值 ， 说 明 可 能 存在 内 存 瓶 有 颈 。 偶 尔 出 现 
的 非 零 值 不 用 在 意 ， 因 为 页 面 调 度 是 虚拟 内 存 的 主要 原理 。 

确定 系统 的 适当 RAM 数 量 的 一 种 方法 是 查看 vmstat 命 令 报告 的 avm 
的 最 大 值 。 将 该 数字 乘 以 4K 得 到 字 节 数 ， 然 后 将 其 与 系统 的 RAM 字 节 
数 比较 。 理 想 情 况 下 ，avm 应 该 小 于 总 RAM。 如 果 不 是 ， 可 能 会 出 现 
一 些 虚 拟 内 存 页 面 调 度量 。 有 多 少 页 面 调 度 发 生 取 决 于 两 个 值 之 间 的 
差 值 。 记 住 ， 虚 拟 内 存 的 概念 是 提供 给 我 们 寻 址 大 于 实 内 存 容量 的 能 
J (一 些 在 RAM 内 存 中 ， 而 另 一 些 在 调 页 空间 中 ) 。 但 是 如 果 虚 拟 内 
存 远 大 于 实 内 存 ， 可 能 造成 过 度 的 页 面 调度 ， 从 而 导致 征 时 。 如 果 avm 
小 于 RAM， 那 么 当 RAM 中 填 满 文件 页 时 就 会 引起 调 页 空间 的 页 面 调 
度 。 这 种 情况 下 ， 调 整 minperm、maxperm 和 maxclient 的 值 可 以 减少 调 
页 空间 的 页 面 调度 量 。 

Sar 工 具 

Sar 工 具 可 以 被 用 来 对 内 存 和 交换 空间 监控 。 

例如 ， 每 10 秒 采样 一 次 ， 连 续 采 样 3 次 ， 监 控 内 存 分 页 ， 命 令 输出 
如 代码 清单 6-18 所 示 。 


代码 清单 6-18 Sar 收集 内 存 使 用 情况 

root@nodel86:3 ~]# sar -r 10 3 

Linux 2.6.32-504.e16.x86 64 (nodel86) 20154-0948 178 x86 64 (24 CPU) 
18 #50415 f^ kbmemfree kbmemused $memused kbbuffers kbcached kbcommit %commit 
18 时 50 分 25 秒 23797880 9032352 27.51 308252 6845976 2902956 7.08 
18 时 50 分 35 秒 23791468 9038764 27.53 308256 6846040 2908948 1.09 
188/504: 451^ 23793928 9036304 27.52 308256 6846088 2902780 7.08 
平均 时 间 : 23794425 9035807 27.52 308255 6846035 2904895 7.08 


输出 项 逐一 说 明 如 下 所 示 。 


kbmemfree: 这 个 值 和 free 命 令 中 的 free 值 基本 一 致 ， 所 以 它 不 包括 
buffer 和 cache 的 空间 ; 

kbmemused: 这 个 值 和 free 命 令 中 的 used 值 基本 一 致 ， 所 以 它 包括 
buffer 和 cache 的 空间 ; 

%memused: 这 个 值 是 kbmemused 和 内 存 总 量 (不 包括 swap) 的 一 
个 百分比 ; 

kbbuffers 和 kbcached: 这 两 个 值 就 是 free 命 令 中 的 buffer 和 cache ; 

kbcommit: 保证 当前 系统 所 需要 的 内 存 ， 即 为 了 确保 不 溢出 而 需 
要 的 内 存 (RAM-swap) ; 

%commit: 这 个 值 是 kbcommit 与 内 存 总 量 (包括 swap) 的 一 个 百 
分 比 。 

针对 内 存 换 页 监控 代码 为 sar-B 10 3， 运 行 后 输出 如 代码 清单 6-19 
所 示 。 


代码 清单 6-19 Sar 针对 内 存 换 页 监控 


root@nodel86:3 ~]# sar -B 10 3 


Linux 2.6.32-504.e16.x86 64 (nodel86) 2015-097] 17H x86 64. (24 CPU) 

18 M 53 4 35 f? pgpgin/s pgpgout/s fault/s majflt/s pgfree/s pgscank/s pgscand/s 
pgsteal/s  $vmeff 
18 时 53 分 45 秒 0.00 37.24 7614.21 0.00 3261.06 0.00 0.00 0.00 0.00 
18A 534554 0.00 35.56 7403.20 0.00 3107.59 0.00 0.00 0.00 0.00 
18854054 0.00 59.66 7641.34 0.00 3354.85 0.00 0.00 0.00 0.00 


平均 时 间 ， 0.00 44.15 7552.82 0.00 3241.08 0.00 0.00 0.00 0.00 


输出 项 说 明 如 下 所 示 。 
pgpgin/s: 表示 每 秒 从 磁盘 或 SWAP 置换 到 内 存 的 字 节 数 (KB) ; 


pgpgout/s : 表示 每 秒 从 内 存 置 换 到 磁盘 或 SWAP 的 字 节 数 
(KB) ; 


faulus: 每 秒 钟 系统 产生 的 缺 页 数 ， 即 主 缺 页 与 次 缺 页 之 和 


(major-minor) ; 


majflt/s: 每 秒 钟 产 生 的 主 缺 页 数 ; 

pgfree/s: 每 秒 被 放 入 空间 队列 中 的 页 个 数 ; 

pgscank/s: 每 秒 被 kswapd 扫 描 的 页 个 数 ，; 

pgscand/s: 每 秒 直 接 被 扫描 的 页 个 数 ，; 

pgsteal/s: 每 秒 钟 从 cache 中 被 清除 来 满足 内 存 需 要 的 页 个 数 ; 

%vmeff : 每 秒 清 除 的 页 ( pgstal ) HAH HN 

(pgscank+pgscand) 的 百分比 。 

总 的 来 说 ， 如 果 系 统 使 用 的 内 存量 保持 稳定 ， 也 没有 启动 新 应 
用 ， 却 依然 有 页 面 调度 ， 说 明 系 统 可 能 在 进行 页 面 交 换 。 值 得 注意 的 
是 ， 如 果 系 统 报告 可 用 内 存 很 少 ， 也 没有 页 面 调度 ， 说 明 系 统 没 有 页 
面 交 换 ， 只 不 过 系统 大 部 分 物理 RAM 都 被 占用 了 。 同 样 ， 如 果 系 统 在 
进行 页 面 调度 ， 但 内 存 充 足 且 没 有 页 面 交 换 ， 说 明 有 应 用 在 启动 。 

当 物 理 内 存 逐 渐 被 耗 尺 时 ， 系 统 开始 将 最 近 最 少 使 用 的 内 存 置 换 
到 虚拟 内 存 。 当 应 用 需要 内 存 页 时 ， 就 会 发 生 页 面 换 入 。 随 着 页 面 调 
度 的 增加 ， 空 朵 内 存 基本 不 变 。 换 名 话说 ， 当 系统 空 内 内 存 很 少时 ， 
内 存 页 面 换 入 和 换 出 的 速度 几乎 一 样 快 。 在 Linux 系 统 进 行 页 面 交换 
AY, Linux vmstat 可 以 观察 到 这 种 典型 模式 。 


6.1.3 监控 磁盘 


应 用 程序 为 了 完成 一 系列 工作 ， 可 能 需要 频繁 地 操作 磁盘 ， 无 论 
是 关系 型 数据 库 、NoSQL 数 据 库 ， 还 是 缓存 系统 ， 都 需要 使 用 到 人 磁 
盘 。 因 此 ， 对 于 磁盘 的 监控 相当 重要 ， 其 重要 性 不 亚 于 CPU、 内 存 。 

UID 是 执行 磁盘 操作 的 用 户 id。PID 是 执行 磁盘 操作 的 进程 id。 同 
一 块 磁盘 块 4153884 上 有 大 量 的 磁盘 访问 (例如 1024 字 节 ) ， 这 意味 着 
存在 优化 机 会 ， 即 相同 的 信息 被 访问 了 多 次 。 应 用 可 以 在 内 存 中 保留 
和 复 用 这 些 数据 ， 而 不 是 每 次 都 用 昂贵 的 磁盘 操作 反复 读 取 。 如 果 读 
取 的 数据 不 相同 ， 则 可 以 一 次 性 读 取 更 大 的 数据 块 从 而 减少 磁盘 访问 
的 次 数 。 

从 更 大 范围 上 来 说 ， 如 果 应 用 的 磁盘 1/O 使 用 率 高 ， 就 值得 深入 分 
析 系 统 磁盘 IO 子 系统 的 性 能 ， 进 一 步 查看 它 预期 的 负载 量 、 磁 盘 服务 
时 间 、 寻 道 时 间 以 及 服务 IO 事件 的 时 间 。 如 果 需 要 改善 磁盘 使 用 率 ， 


可 以 使 用 一 些 策略 。 从 硬件 和 操作 系统 上 看 ， 更 快 的 存储 设备 、 文 件 
系统 扩展 到 多 个 磁盘 、 操 作 系统 调 优 使 得 可 以 缓存 大 量 的 文件 系统 数 
据 结构 ， 这 些 都 属于 改进 磁盘 IO 使 用 率 的 策略 方式 。 从 应 用 角度 上 来 
看 ， 任 何 减 少 磁盘 活动 的 策略 都 有 所 帮助 ， 例 如 使 用 带宽 的 输入 输出 
流 以 减少 读 、 写 操作 次 数 ， 或 在 应 用 中 集成 缓存 的 数据 结构 以 减少 或 
消除 磁盘 交互 。 缓 冲 流 减 少 了 调用 操作 系统 调用 的 次 数 从 而 降低 系统 
态 CPU 使 用 率 。 虽 然 这 不 会 改善 磁盘 IO 性 能 ， 但 可 以 使 更 多 CPU 周期 
用 于 应 用 的 其 他 部 分 或 者 其 他 运行 的 应 用 。JDK 提 供 了 缓冲 数据 结构 ， 
也 容 m 使 A, 如 ” java.io.BufferedInputStream 和 
java.io.BufferedOutputStreamo 

关于 磁盘 性 能 ， 有 一 个 经 常 被 忽视 的 方法 ， 就 是 检查 磁盘 缓存 是 
否 开启。 有 一 些 系统 将 磁盘 缓存 设置 为 茶 用 。 开 局 磁 盘 缓存 可 以 改善 
严重 依赖 磁盘 IO 的 应 用 的 性 能 。 然 而 ， 如 果 系 统 默认 设置 为 禁用 磁盘 
缓存 ， 你 应 该 加 以 注意 ， 因 为 一 旦 开启 磁盘 缓存 ， 意 外 的 电源 故障 可 
能 会 造成 数据 损坏 。 

注意 ， 和 前 面 一 样 ， 我 们 本 小 节 的 监控 方式 演示 都 会 按照 Windows 
篇 和 Linux 篇 ， 其 中 Windows 针 对 的 是 windows7 操 作 系统 ，Linux 针 对 的 
是 CentosV6.5 操 作 系统 。 

6.1.3.1 磁盘 使 用 率 监控 工具 一 Windows 篇 

性 能 计数 器 (Perfmon) 

前 面 已 经 针对 Perfmon 的 使 用 方式 做 了 详细 的 介绍 ， 这 里 不 再 殉 
述 。Perfmon 提 供 了 比较 全 面 的 系统 性 能 指标 ， 并 且 能 够 根据 性 能 管理 
的 要 求 订 制 日 志 内 容 、 制 定 关 键 指标 偏离 时 的 和 警报 措施 。 表 6-4 列 出 了 
Perfmon 可 以 监控 磁盘 相关 的 性 能 对 象 。 


表 6-4 Perfmon 磁 盘 监 控 功 能 表 


提供 的 信息 
% Busy Time 指 磁盘 驱动 器 人 于 为 读 或 写 入 请 求 提供 服务 所 用 的 时 间 的 百 
分 此 


Physical isk | Avg. Disk Queue Length 指 读 取 和 写 入 请 求 (为 所 选 磁盘 在 实例 间隔 中 列队 
Disk Queue Length | 的 ) 的 平均 数 


Physical | Current Disk | Current Disk Queue Length 指 在 收集 操作 数据 时 在 磁盘 上 nent 

Disk Queue Length | 目 。 它 包括 在 快照 内 存 时 正在 为 其 提供 服务 中 的 请 求 。 这 是 一 个 即时 长 度 
而 非 一 定 间隔 时 间 的 平均 值 。 多 主轴 磁盘 设备 可 以 cB 操作 ， 
但 是 其 他 同时 发 生 的 请 求 为 等 候 服务 。 这 个 计数 器 可 能 会 反映 一 个 暂时 的 


高 或 低 的 列队 长 度 ， 但 是 如 果 在 磁盘 驱动 器 存在 持续 负载 ， 可 能 值 会 总 是 
很 高 。 请 求 等 待 时 间 与 这 个 列队 的 长 度 减 去 磁盘 上 的 主轴 成 正比 。 这 个 差 
值 应 小 于 2 才能 保持 展 好 的 性 能 

% Free Space | % Free Space 是 所 迁 定 的 多 辑 磁盘 驱动 器 上 总 的 可 用 空 闪 空 间 的 百分比 
Disk 


FreeMegabytes | 可 用 的 MB 显示 磁盘 驱动 器 上 尚未 分 配 的 空间 
Disk 


6.1.3.2 磁盘 使 用 率 监控 工具 一 Linux 篇 

对 于 有 磁盘 操作 的 应 用 来 说 ， 查 找 性 能 问题 ， 就 应 该 监控 磁盘 
I/Oo Ferd 的 核心 功能 需要 大 量 使 用 磁盘 ， 例 如 数据 库 ， 几 乎 所 有 
的 应 用 都 会 用 日 志 记 录 重 要 的 状态 信息 或 事件 发 生 时 的 应 用 行为 。 磁 
盘 IO 使 用 率 ay 是 理解 应 用 磁盘 使 用 情况 最 有 用 的 监控 数据 ，Linux 可 以 使 
用 iostat 来 监控 系统 的 磁盘 使 用 率 。 

iostat 命 令 

iostat 用 于 输出 CPU 和 磁盘 IO 相关 的 统计 信息 ， 我 们 来 看 一 下 iostat 
的 最 基础 输出 如 代码 清单 6-20 所 示 。 


代码 清单 6-20 istat 检测 磁盘 使 用 的 基本 输出 
[root@nodel86:2 zhoumingyao]# iostat 
Linux 2.6.32-504.e16.x86 64 (node186) 2015409H168 x86 64 (24 CPU) 
avg-cpu: $user  $nice $system Siowait ‘%steal ‘idle 
0.44 0.00 0.40 0.00 0.00 99.16 


Device: tps Blk read/s Blk wrtn/s Blk read Blk wrtn 
sda 3.28 20.55 97,22 743218 3515392 
sdc 0.02 0.22 0.01 7954 288 

sdb 0.14 21,52 0.10 778106 3544 
具体 解释 一 下 各 个 字段 的 意思 。 

avg-cpu 段 


Yuser: 在 用 户 级 别 运 行 所 使 用 的 CPU 的 百分比 。 
?onice: nice 操 作 所 使 用 的 CPU 的 百分比 。 

%sys: 在 系统 级 别 (kernel) 运行 所 使 用 CPU 的 百分比 。 
%iowait: CPU 等 待 硬件 IO 时 ， 所 占用 CPU 百分比 。 
%idle: CPU 空 内 时 间 的 百分比 。 

Device 段 

tps: 每 秒 钟 发 送 到 的 MO 请 求 数 。 

BIk read/s: 每 秒 读 取 的 block 数 。 

Blk_wrtn/s: 每 秒 写 入 的 block 数 。 

BIk read: 读 入 的 block 总 数 。 

BIk wrtn: 写 入 的 block 总 数 。 

如 果 需 要 进一步 调用 更 多 的 个 性 化 输出 ， 我 们 需要 配置 iostat 的 参 
参数 表 如 下 所 示 。 

-c: 仅 显 示 CPU 统 计 信 息 ， 与 -4 选项 互 斥 。 

-d: 仅 显 示 磁 盘 统计 信息 .与 -c 选 项 互 斥 。 

-k: 以 K 为 单位 显示 每 秒 的 磁盘 请 求 数 ， 默 认 单位 块 。 


效 


M» 


-p device|ALL 与 -x 选项 互 矿 ， 用 于 显示 块 设 备 及 系统 分 区 的 统计 信 
息 。 也 可 以 在 -p 后 指定 一 个 设备 名 ， 如 : dtiostat-p devidename 或 显示 
所 有 设备 #iostat-p ALL。 

-: 在 输出 数据 时 ， 打 印 搜集 数据 的 时 间 。 

-V: 打印 版 本 号 和 帮助 信息 。 

x: 输出 扩展 信息 。 

如 果 想 要 每 隔 两 秒 输出 一 次 针对 磁盘 的 监控 ， 可 以 采用 如 下 命令 
和 输出 如 代码 清单 6-21 所 示 。 


代码 清单 6-21 iostat 每 隔 两 秒 检测 一 次 
[root@nodel86:2 zhoumingyao]# iostat -d 2 


Linux 2.6.32-504.016.x86 64 (nodel86) 2015409] 16H x86 64. (24 CPU) 
Device: tps Blk read/s Blk wrtn/s Blk read Blk wrtn 

sda 3.28 20.35 97.06 743234 3545336 

sdc 0.02 0.22 0.01 1954 288 

sdb 0.14 21.30 0.10 718106 3544 

Device: tps Blk read/s Blk wrtn/s Blk read Blk wrtn 

sda 3.50 0.00 96.00 0 192 

sdc 0.00 0.00 0.00 0 0 

sdb 0.00 0.00 0.00 0 0 


如 果 想 要 让 系统 自动 每 隔 2 秒 执行 一 次 iostat 命 令 ， 显 示 一 次 设备 统 
计 信息 ， 总 共 输 出 6 次 ， 命 令 和 输出 清单 如 代码 清单 6-22 所 示 。 


代码 清单 6-22 一 共 输 出 6 次 


[root6node186:2 zhoumingyao]# iostat -d 2 6 


Linux 2.6.32-504.e16.x86 64 (nodel86) 


Device: 
sda 
sdc 
sdb 
Device: 
sda 
sdc 
sdb 
Device: 
sda 
sdc 
sdb 
Device: 
sda 
sdc 
sdb 
Device: 
sda 
sdc 
sdb 
Device: 
sda 
sdc 
sdb 


如 果 想 要 系统 自动 每 隔 2 秒 显 


tps 
3.29 
0.02 
0.14 

tps 
7.00 
0.00 
0.00 

tps 
3.00 
0.00 
0.00 

tps 
4.50 
0.00 
0.00 

tps 
1.00 
0.00 
0.00 

tps 
7.46 
0.00 
0.00 


Blk read/s 
20.24 
0.22 
"AU 
Blk read/s 
0.00 
0.00 
0.00 
Blk read/s 
0.00 
0.00 
0.00 
Blk read/s 
0.00 
0.00 
0.00 
Blk read/s 
0.00 
0.00 
0.00 
Blk read/s 
0.00 
0.00 
0.00 


Blk wrtn/s 
96.98 
0.01 
0.10 

Blk wrtn/s 

200.00 
0.00 
0.00 

Blk wrtn/s 
52.00 
0.00 
0.00 

Blk wrtn/s 

136.00 
0.00 
0.00 

Blk wrtn/s 
8.00 
0.00 
0.00 

Blk wrtn/s 

171.14 
0.00 
0.00 


Blk read 
143234 
7954 
778106 
Blk read 
0 
0 
0 
Blk read 


Blk read 
0 
0 
0 
Blk read 


Blk read 
0 
0 
0 


2015409 4 168 x86 64_ 


Blk wrtn 
3560504 
288 
3544 
Blk wrtn 
400 
0 
0 
Blk wrtn 
104 
0 


Blk wrtn 
212 
0 
0 
Blk wrtn 
16 
0 
0 
Blk wrtn 
344 
0 
0 


显示 一 次 sdal、sdcl 两 个 设 


计 信息 ， 共 输出 6 次 ， 命 令 和 输出 如 代码 清单 6-23 所 示 。 


(24 CPU) 


备 的 扩展 统 


代码 清单 6-23 每 隔 2 秒 显示 一 次 sda1、sdc1 两 个 设备 的 扩展 统计 信息 


[root@nodel86:2 zhoumingyao]# iostat -x sdal sdcl 2 6 


Linux 2.6.32-504.e16.x86 64 (nodel86) 2015 年 09 月 16 日 x86 64_ (24 CPU 
avg-cpu: $user ‘%nice $system $iowait $steal ‘%idle 

0.44 0.00 0.39 0.00 0.00 99.16 
Device: rrqm/s wrqm/s  r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.25 9.16 0.32 2.96 20.15 96.95 35.69 0.01 2.78 
0.07 
sdcl 0.01 0.00 0.02 0.00 0.18 0.01 12.08 0.00 0.45 
0.00 
avg-cpu: $user ‘%nice %system $iowait %steal idle 

0.19 0.00 0.10 0.00 0.00 99.71 
Device: rrqm/s wrqm/s  r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
sdcl 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
avg-cpu: %user ‘nice $system $iowait %steal ‘idle 

0.67 0.00 0.40 0.00 0.00 98.94 
Device: rrqu/s wrqm/s  r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.00 16.50 0.00 7.50 0.00 192.00 25.60 0.00 0.20 
0.10 
sdcl 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
avg-cpu: $user ‘nice %system $iowait %steal idle 

0.02 0.00 0.04 0.00 0.00 99.94 
Device: rrqm/s wrqm/s  r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
sdci 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
avg-cpu: %user ‘nice $system $iowait %steal ‘idle 

0.71 0.00 0.42 0.00 0.00 98.87 
Device: rrqm/s wrqm/s  r/s  w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.00 11.50 0.00 5.00 0.00 132.00 26.40 0.00 0.10 0.10 
sdcl 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
avg-cpu: $user ‘%nice %system $iowait %steal ‘idle 

0.19 0.00 0.13 0.00 0.00 99.69 
Device: rrqn/s wrqm/s  r/s w/s rsec/s wsec/s avgrq-sz avgqu-sz await svctm 
sdal 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 
sdcl 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 


$util 
0.00 
0.00 


如 果 想 要 系统 自动 每 隔 2 秒 显示 一 次 sdal 及 上 面 所 有 分 区 的 统计 信 
息 ， 一 共 输 出 2 次 ， 则 命令 及 输出 如 代码 清单 6-24 所 示 。 


代码 清单 6-24 显示 两 次 sda1 及 上 面 所 有 分 区 的 统计 信息 
[root@nodel86:2 zhoumingyao]# iostat -p sdal 2 2 
Linux 2.6.32-504.e16.x86 64 (node186) 2015 #09 H 16 H x86 64. (24 CPU) 


avg-cpu: $user  $nice $system Siowait $steal  $idle 


0.44 0.00 0.39 0.00 0.00 99.16 
Device: tps Blk read/s Blk wrtn/s Blk read Blk wrtn 
avg-cpu: $user  $nice $system $iowait $steal  $idle 

0.29 0.00 0.19 0.00 0.00 99.52 
Device: tps Blk read/s Blk wrtn/s Blk read Blk wrtn 


df 命令 

Linux 系 统 中 需要 监控 磁盘 各 分 区 的 使 用 情况 ， 避 免 由 于 各 种 突 发 
情况 ， 造 成 磁盘 空间 被 消耗 列 尽 的 情况 ， 例 如 某 个 分 区 被 Oracle 的 归档 
日 志 耗 尽 ， 导 致 后 续 的 日 志文 件 无 法 归档 ， 这 时 ORACLE 数据 库 就 会 
出 现 错误 。 

一 般 查 看 磁盘 各 分 区 的 使 用 情况 可 以 通过 df 命令 来 查看 ， 我 们 采用 
df-h 命 令 可 以 输出 基本 的 磁盘 数据 ， 如 代码 清单 6-25 所 示 。 


代码 清单 6-25 输出 基本 磁盘 数据 


[root@nodel86:2 zhoumingyao]# df -h 


Filesystem Size Used Avail Use% Mounted on 
/dev/sdal 1846 316 144G 18% / 

tmpfs 16G 160K 16G 1$ /dev/shm 

/ dev/sdcl 459G 70M 435G 1% /data 


/dev/sdb2 451G 75G 354G 18% /home 


如 果 我 们 想 要 获取 磁盘 的 使 用 百分比 ， 可 以 采用 如 下 Shell 脚 本 ， 
这 样 可 以 更 加 直接 地 拿 到 输 出 信息 "^o 


代码 清单 6-26 获取 磁盘 的 使 用 百分比 


root@nodel86:2 zhoumingyao]# df -P | grep /dev | awk '(print $5]' | cut -f 1 -d 


或 者 也 可 以 采用 下 面 这 个 命令 ， 输 出 结果 一 样 。 


代码 清单 6-27 获取 磁盘 的 使 用 百分比 


[root@nodel86:2 zhoumingyao]# df -P | grep /dev | awk '(print $5]' | sed 's/$//g' 


vmstat 命 令 
vmstat 命 令 也 可 以 输出 磁盘 监控 数据 ， 如 代码 清单 6-28 所 示 。 


代码 清单 6-28 vmstat 输出 磁盘 监控 数据 


[root@node186:2 zhoumingyao]# vmstat 1 10 


r b swpd free buff cache si so bi bo in cs us sy id wa st 
0 0 0 29585428 136212 1049588 0 0 1 2 0 410099 0 0 
2 0 0 29582200 136216 1049616 0 0 0 72 761 675 0 099 0 0 


TAM 


vmstat 命 令 运 行 的 输出 和 磁盘 相关 的 数据 解释 如 下 所 示 。 
Swap 列 


si: 从 磁盘 交换 到 内 存 的 交换 页 数量 ， 单 位 : KB/ 秒 ; 
so: 从 内 存 交 换 到 磁盘 的 交换 页 数量 ， 单 位 : KB/ 秒 。 


IO 列 

bo: 从 块 设备 接收 到 的 块 数 ， 单 位 : 块 / 秒 。 

Sar 工 具 

bi: 发 送 到 块 设备 的 块 数 ， 单 位 : 块 / 秒 ; 

例如 ， 每 10 秒 采样 一 次 ， 连 续 采 样 3 次 ， 报 告 缓冲 区 的 使 用 情况 ， 
输出 如 代码 清单 6-29 所 示 。 


代码 清单 6-29 Sar 命令 输出 缓冲 区 使 用 情况 
root@nodel86:3 ~]# sar -b 10 3 
Linux 2.6.32-504.e16.x86 64 (nodel86) 2015-094] 17H — x86 64. (24 CPU) 
188,57 2 29 8 tps rtps wtps bread/s  bwrtn/s 
188574 39 9 4.01 0.00 4.01 0.00 88.18 
1885742499 3.10 0.00 3.10 0.00 79.20 
18857425599 2.70 0.00 2.70 0.00 73.60 
平均 时 间 ; 3.27 0.00 3.27 0.00 80.32 


输出 项 说 明 如 下 所 示 。 

tps: 每 秒 钟 物理 设备 的 MO 传输 总 量 ; 

rtps: 每 秒 钟 从 物理 设备 读 入 的 数据 总 量 ; 

wtps: 每 秒 钟 向 物理 设备 写 入 的 数据 总 量 ; 

bread/s: 每 秒 钟 从 物理 设备 读 入 的 数据 量 ， 单 位 为 块 /s ; 
bwrtn/s: 每 秒 钟 向 物理 设备 写 入 的 数据 量 ， 单 位 为 块 /s。 


6.1.4 监控 网 络 


不 管 Java 应 用 在 哪个 操作 系统 上 运行 ， 都 需要 工具 显示 该 应 用 所 用 
网 络 接口 的 网 络 使 用 率 。 分 布 式 Java 应 用 的 性 能 和 扩展 性 受 限于 网 络 带 
宽 或 网 络 IO 的 性 能 。 举 例 来 说 ， 如 果 发 送 到 系统 网 络 接口 硬件 的 消息 
量 超过 了 它 的 处 理 能 力 ， 消 息 就 会 进入 操作 系统 的 缓冲 区 ， 这 会 导致 
应 用 延迟 。 此 外 网 络 上 发 生 的 其 他 状况 也 会 导致 延迟 。 即 便 用 操作 系 
统 的 内 腐 工 具 ， 也 难以 直接 识别 和 监控 网 络 使 用 率 。 


单 次 读 写 数据 量 小 而 网 络 读 写 量 大 的 应 用 会 消耗 大 量 的 系统 态 
CPU， 产 生 大 量 的 系统 调用 。 对 于 这 类 应 用 ， 减 少 系统 态 CPU 的 策略 
是 减少 网 络 读 写 的 系统 调用 。 此 外 ， 使 用 非 阻塞 的 JavaNIO 而 不 是 阻塞 
的 Java.net.Socket， 减 少 处 理 请 求 和 发 送 响 应 的 线程 数 ， 也 可 以 改善 应 
用 性 能 。 

从 非 阻 塞 Socket 中 读 取 数据 的 策略 是 ， 应 用 在 每 次 读 请 求 时 尽 可 能 
多 地 读 取 数据 。 同 样 ， 当 往 socket 中 写 数据 时 ， 每 个 写 调用 应 该 尽 可 能 
多 地 写 。 一 些 Java NIO 框 架 包 含 了 这 些 事件 ， 例 如 Grizzly 项 目 。Java 
NIO 框 架 也 有 助 于 简化 客户 端 /服务 器 类 型 应 用 的 开发 。JDK 提 供 的 Java 
NIO 只 是 一 种 原始 实现 ， 很 容易 导致 Java API 的 误 用 而 使 应 用 性 能 变 
差 ， 建 议 使 用 Java NIO 框 架 。 关 于 NIO 的 相关 内 容 可 以 参见 本 书 其 他 章 
节 。 

我 们 本 小 节 的 监控 方式 演示 都 会 按照 Windows 篇 和 Linux 篇 ， 其 中 
Windows 针 对 的 是 Windows7 操 作 系 统 ，Linux 针 对 的 是 CentosV6.5 操 作 
系统 。 

6.1.4.1 磁盘 使 用 率 监 控 工 具 -windows 篇 

前 面 已 经 针对 Perfmon 的 使 用 方式 做 了 详细 的 介绍 ， 这 里 不 再 歼 
述 。Perfmon 提 供 了 比较 全 面 的 系统 性 能 指标 ， 并 且 能 够 根据 性 能 管理 
的 要 求 订 制 日 志 内 容 、 制 定 关 键 措 标 偏离 时 的 警报 措施 。 表 6-5 列 出 了 
Perfmon 可 以 监控 网 络 相 关 的 性 能 对 象 。 


表 6-5 Perfmon 监 控 网 络 


m 提供 的 信息 
Network Interface Bytes Total/sec Bytes Total/sec 是 发 送 和 接收 字 节 的 速率 ， 包 括 帧 字符 在 内 。 


Packetslsec 为 发送 和 接收 数据 包 的 速 来 。 


Windows 上 监控 网 络 使 用 率 ， 需 要 知道 被 监控 网 络 接 口 的 带宽 ， 以 
及 网 络 接口 传递 的 数据 量 。 
网 络 接口 每 秒 传递 的 字 节 数 可 以 通过 性 能 计数 器 \Network Interface 
(*) \Bytes Total/sec 获 得 。 通 配 符 “*” 表 示 报 告 的 是 系统 所 有 网 络 接口 
的 总 带宽 。 可 以 用 命令 typeperf\Network Interface (*) \Bytes Total/sec 查 
看 网 络 接口 名 ， 然 后 用 你 打算 监控 的 网 络 接口 替换 通配符 “*”。 例 如 ， 
假定 typeperANetwork Interface (*) \Bytes Total/sec 报 告 网 络 接口 为 


Intel[R] 82566DM-2 Gigabit Network Connection ， isatatp , 
gateway. 2wire.net, Local Area Conntection*11， 可 以 得 知 系统 安装 的 网 
络 接 口 卡 是 Intel 网 卡 。 在 Performance Monitor 里 或 用 typeperf 命 令 添加 性 
能 计数 器 时 ， 你 可 以 用 Intel[R] 82566DM-2 Gigabit Network Connection 
替换 通配符 “*”。 

除了 接口 传递 的 字 节 数 ， 还 必须 获得 网 络 接口 的 带宽 。 可 以 通过 
性 能 计数 器 \Network Interface (*) \Current Bandwidth 获 得 ， 其 中 “*” 应 
该 用 被 监控 的 网 络 接口 替换 。 

重点 需要 注意 的 是 ， 性 能 计数 器 Current Bandwidth 的 带宽 单位 是 
bits/s。 相 比 而 言 ，Bytes Total/sec 是 bytes。 所 以 网 络 使 用 率 的 计算 公式 
需要 考虑 适当 的 单位 ，bits/s 或 bytes/s。 

下 面 是 两 个 计算 网 络 使 用 率 的 攻势 : 第 一 个 是 Current Bandwidth 除 
以 8 变 为 字 节 ， 第 二 个 是 Bytes Totalsec 乘 以 8 变 为 比特 位 。 


network utilization $ = Bytes Total/sec/(Current BandWidth/8)*100 


或 者 

network utilization $ = (Bytes Total/sec*8)/Current BandWidth*100 
也 可 以 点 击 Task Manager FR BJ Networking X1 WS £2 Windows B W Z& feb 
用 率 。 

6.1.4.2 磁盘 使 用 率 监控 工具 一 Linux 篇 

Linux 有 netstat 及 sysstat 这 两 个 可 选 的 工具 安装 包 ， 这 两 者 都 不 会 报 
告 网 络 使 用 率 。 它 们 的 作用 时 ， 都 可 以 提供 每 秒 发 送 和 接受 的 包 数 ， 
包括 错误 和 冲突 的 包 。 少 量 冲突 是 以 太 网 的 正常 情况 ， 大 量 错误 通常 
是 因为 网 络 接口 卡 出 错 、 糟 糕 的 线路 或 是 自动 协商 机 制 (Auto- 
Negotiation) 出 了 问题 。 

Netstat 命 令 

Netstat 命 令 用 于 显示 各 种 网 络 相 关 信息 ， 如 网 络 连接 ， 路 由 表 ， 接 
口 状 态 (Interface Statistics) ，masquerade 连 接 ， 多 播 成 员 (Multicast 
Memberships) 等 。 


从 整体 上 看 ，netstat 的 输出 结果 可 以 分 为 两 个 部 分 。 


一 个 是 Active Internet connections ， 称 为 有 源 TCP 连 接 ， 其 中 " 
Recv-Q” 和 ”Send-Q” 指 %0A 的 是 接收 队列 和 发 送 队 列 。 这 些 数字 一 
般 都 应 该 是 0。 如 果 不 是 则 表示 软件 包 正 在 队列 中 堆积 。 这 种 情况 只 能 
在 非常 少 的 情况 见 到 。 

另 一 个 是 Active UNIX domain sockets， 称 为 有 源 UNIX 域 套 接 口 

(和 网 络 套 接 字 一 样 ， 但 是 只 能 用 于 本 机 通信 ， 性 能 可 以 提高 一 
倍 ) 。 

Proto 显 示 连 接 使 用 的 协议 ，RefCnt 表 示 连 接 到 本 套 接口 上 的 进程 
号 ，Types 显 示 套 接口 的 类 型 ，State 显 示 套 接口 当前 的 状态 ，Path 表 示 
连接 到 套 接口 的 其 他 进程 使 用 的 路 径 名 。 

我 们 运行 netstat 命 令 ， 不 使 用 任何 参数 ， 输 出 如 代码 清单 6-30 所 
7]vo 


代码 清单 6-30 NetStat 输出 


Active Internet connections (w/o servers) 


Proto Recv-Q Send-Q Local Address Foreign Address State 
tcp 0 0 nodel86:mysql 10.17.139.251:52684 ESTABLISHED 
tcp 0 0 nodel86:mysql 10.17.139.251:52071 ESTABLISHED 
tcp 0 0 nodel86:mysql 10.17.139.251:52674 ESTABLISHED 
tcp 0 0 nodel86:microsoft-ds  10.17.129.12:57324 ESTABLISHED 
tcp 0 0 nodel86:microsoft-ds —10.17.128.128:59226 ESTABLISHED 
tcp 0 0 nodel86:mysql 10.17.139.251:59847 ESTABLISHED 
tcp 0 0 nodel86:mysql 10.17.139.251:526718 ESTABLISHED 
Active UNIX domain sockets (w/o servers) 

Proto RefCnt Flags Type State I-Node Path 

unix 29 [ ] DGRAM 13902 /dev/log 

unix 2 [ ] DGRAM 14809 @/org/freedesktop/hal/udev_event 
unix 2 [ ] DGRAM 10507 @/org/kernel/udev/udevd 


Netstat 常 见 参 数 如 下 。 
-a (all) : 显示 所 有 选项 ， 默 认 不 显示 LISTEN 相 关 ; 
-t (tcp) : 仅 显 示 tcp 相 关 选 项 ; 


-u (udp) : 仅 显 示 udp 相 关 选 项 ; 

n: 拒绝 显示 别名 ， 能 显示 数字 的 全 部 转化 成 数字 ; 

-l: 仅 列 出 有 在 Listen (监听 ) 的 服务 状态 ; 

-p; 显示 建立 相关 链接 的 程序 名 ; 

+: 显示 路 由 信息 ， 路 由 表 ; 

-e: 显示 扩展 信息 ， 例 如 uid 等 ; 

-s: 按 各 个 协议 进行 统计 ; 

-c: 每 隔 一 个 固定 时 间 ， 执 行 该 netstat 命 令 。 

注意 ，LISTEN 和 LISTENING 的 状态 只 有 用 -a 或 者 -] 才 能 看 到 。 

netstat 能 报告 一 定 间隔 内 接收 或 发 送 的 包 数 ， 也 仍然 难以 知道 网 络 
接口 是 否 被 充分 利用 。 例 如 ， 使 用 netstat 命 令 显示 2500 包 / 秒 通过 网 络 
接口 卡 ， 但 你 无 法 知道 网 络 使 用 率 是 100% 还 是 1%， 只 能 知道 存在 网 络 
拥堵 ， 而 这 也 是 在 你 不 知道 底层 网 络 卡 传送 速率 和 包 大 小 的 情况 下 ， 
能 够 得 出 的 唯一 结论 。 简 单 来 说 ， 很 难 用 Linux 的 netstat 判 断 应 用 的 性 
能 是 否 受 网 络 使 用 率 的 限制 。 

如 果 需 要 列 出 所 有 的 端口 ， 包 括 监听 的 和 未 监听 的 ， 命 令 和 输出 
如 代码 清单 6-31 所 示 。 


代码 清单 6-31 NetStat 列 出 所 有 端口 
[root@nodel86:3 ~]# netstat -a | more 


Active Internet connections (servers and established) 


Proto Recv-Q Send-Q Local Address Foreign Address State 
tcp 0 0 *:5904 age LISTEN 

tcp 0 0 node186:mysql 10,171,135. 291:51967 ESTABLISHED 
tcp 0 0 node186:mysql 10,11.138. 251152681 ESTABLISHED 
tcp 0 0 node186:mysql 1.17, 138251951950 ESTABLISHED 


如 果 只 想 列 出 TCP 端 口 ， 命 令 和 输出 如 代码 清单 6-32 所 示 。 


代码 清单 6-32 NetStat 只 列 出 TCP 端口 
[root@nodel86:3 ~]# netstat -at 


Active Internet connections (servers and established) 


Proto Recv-Q Send-Q Local Address Foreign Address State 
tcp 0 0 *:6001 Hy LISTEN 
tcp 0 0 *:6004 ayes LISTEN 
tcp 0 0 192.168.122.1:domain Ry LISTEN 
tcp 0 0 *:ssh = LISTEN 
tcp 0 0; localhost:ipp *:* LISTEN 

tcp 0 0 localhost:smtp EE LISTEN 


如 果 需 要 列 出 所 有 UDP 端口 ， 命 令 和 输出 如 代码 清单 6-33 所 示 。 


代码 清单 6-33 NetStat 只 列 出 UDP 端口 
[root@nodel86:3 ~]# netstat -au 


Active Internet connections (servers and established) 


Proto Recv-Q Send-Q Local Address Foreign Address State 
udp 0 0 192.168.122.1:domain aie 

udp 0 0 *:ha-cluster TER 

udp 0 0 localhost:703 hot 

udp 0 0 *:bootps us 

udp 0 0 *:974 Ert 

udp 0 0 *:sunrpc Mut 

udp 0 0 *:ipp ud 


如 果 想 要 监听 Socket， 命 令 和 运行 输出 如 代码 清单 6-34 所 示 。 


代码 清单 6-34 NetStat 监听 Socket 
netstat -1 
Active UNIX domain sockets (only servers) 
Proto RefCnt Flags Type State I-Node Path 
[ ACC ] STREAM LISTENING 22877 Q/tmp/.ICE-unix/4248 
[ ACC ] STREAM LISTENING 22851 /tmp/ssh-1ASCjW4248/agent.4248 
[ ACC ] STREAM LISTENING 288381 /var/lib/mysql/mysql.sock 
[ ACC ] STREAM LISTENING 19249 Q/tmp/.ICE-unix/3724 
[ ACC ] STREAM LISTENING 23368 /tmp/keyring-xhngwZ/socket 


unix 2 
2 
2 
2 
à 

unix 2 ([ ACC] STREAM LISTENING 23392 /tmp/keyring-xhngwZ/socket.ssh 
2 
2 
2 
2 
2 


unix 
unix 
unix 
unix 
unix [ ACC ] STREAM LISTENING 23394 /tmp/keyring-xhngwZ/socket.pkcs11 

[ ACC ] STREAM LISTENING 26874/tmp/orbit-gdm/linc-13a0-0-59afd77a87fa5 
[ ACC ] STREAM LISTENING 26946 /tmp/orbit-gdm/linc-139d-0-794105b88a89b 
[ ACC ] STREAM LISTENING 27058 /tmp/orbit-gdm/linc-13a5-0-520f3ac6aal5ba 
[ ACC ] STREAM LISTENING 27095 /tmp/orbit-gdm/linc-13a7-0-18912d61b50d5 


unix 
unix 


unix 


unix 


ifstat LA 
ifstat 工 具 是 个 网 络 接口 监测 工具 ， 比 较 简 单 看 网 络 流量 。 简 单 的 
执行 如 下 所 示 ， 默 认 ifstat 不 监控 回环 接口 ， 显 示 的 流量 单位 是 KB。 


代码 清单 6-35 ifstat 模式 输出 
#ifstat 
eth ethl 
KB/s in KB/s out KB/s in KB/s out 
0.07 0.20 0.00 0.00 
0.07 0.15 0.58 0.00 


如 果 想 要 监控 所 有 网 络 接口 ， 可 以 采用 下 面 的 命令 。 


代码 清单 6-36 ifstat 监控 所 有 网 络 接口 
# ifstat -a 
lo eth ethl 
KB/s in KB/s out KB/s in KB/s out KB/s in KB/s out 
0.00 0.00 0.28 0.58 0.06 0.06 
0.00 0.00 1.41 1:13 0.00 0.00 
0.61 0.61 0.26 0.23 0.00 0.00 


iftop 工 具 

iftop 是 一 款 实时 流量 监控 工具 ， 监 控 TCP/IP 连 接 等 ， 缺 点 是 无 报 
表 功 能 。 必 须 以 root 身 份 才能 运行 。 

默认 是 监控 第 一 块 网 卡 的 流量 : iftop 

监控 eth1: iftop-i eth1 

直接 显示 IP， 不 进行 DNS 反 解析 : iftop -n 

直接 显示 连接 塌 编 号 ， 不 显示 服务 名 称 : iftop-N 

显示 某 个 网 段 进 出 封包 流量 : iftop-F 192.168.1.0/24 or 
192.168.1.0/255.255.255.0 

通过 iftop 的 界面 很 容易 找到 哪个 jp 在 霸占 网 络 流量 ， 这 个 是 ifstat 做 
不 到 的 。 不 过 iftop 的 流量 显示 单位 是 Mb ， 这 个 b 是 bit， 是 位 ， 不 是 字 
节 ， 而 ifstat 的 KB， 这 个 B 就 是 字 节 了 ，byte 是 bit 的 8 倍 。 初 学 者 容易 被 
误导 。 

nload 工 具 

如 果 你 仅仅 是 想 查询 当前 服务 器 的 带宽 ，nload 绝 对 是 个 很 好 用 的 
一 个 工具 ， 功 能 虽然 很 单一 ， 但 是 很 强 。 虽 然 不 能 像 iptraf 那 样 ， 可 针 
XIP, 协议 等 条 件 来 查询 ， 可 以 实时 地 监控 网 卡 的 流量 ， 分 输入 流量 
Incoming 和 输出 流量 Outgoing 两 部 分 ， 同 时 统计 当前 、 平 均 、 最 小 、 最 
大 、 总 流量 的 值 ， 并 且 用 动态 图 形 方 式 表现 出 来 ， 让 你 一 目 了 然 。 

输入 nload 回 车 即 可 看 到 动态 流量 信息 ， 也 可 以 指定 网 卡 ， 如 nload 
ethl。 还 可 以 指定 是 以 K 或 M 来 显示 流量 ， 如 nload-u M 显 示 的 流量 是 以 
MB 为 单位 的 。 


代码 清单 6-37 nload 输出 


Incoming 
Curr: 0.00 MByte/s 
Avg: 0.00 MByte/s 
Min: 0.00 MByte/s 
Max: 0.00 MByte/s 
Ttl: 560.00 Byte 
Outgoing: 


Curr: 0.00 MByte/s 
Avg: 0.00 MByte/s 
Min: 0.00 MByte/s 
Max: 0.00 MByte/s 
Ttl: 560.00 Byte 


6.2 监控 JVM 活 动 


监控 通常 是 指 一 种 在 生产 、 质 量 评估 或 者 开发 环境 中 实施 的 带 有 
预防 或 主动 性 的 活动 。 当 应 用 干系 人 报告 性 能 问题 却 没有 提供 足以 找 
到 根本 原因 的 线索 时 ， 首 先 会 进行 性 能 监控 ， 随 后 是 性 能 分 析 。 性 能 
监控 也 有 助 于 找 出 对 应 用 响应 性 或 吞吐 量 尚未 造成 严重 影响 的 潜在 问 
题 。 

相 比 而 言 ， 性 能 分 析 是 一 种 以 侵入 方式 收集 运行 性 能 数据 的 活 
动 ， 它 会 影响 应 用 的 否 吐 量 或 响应 性 。 性 能 分 析 是 对 性 能 监控 或 是 对 
干系 人 所 报 问题 的 回应 ， 关 注 的 范围 通常 比 性 能 监控 更 集中 。 性 能 分 
析 很 少 在 生产 环境 中 进行 ， 通 常 是 在 质量 评估 、 测 试 或 开发 环境 中 ， 
常常 是 性 能 监控 之 后 再 采取 的 行动 。 

与 性 能 监控 和 性 能 分 析 相 比 ， 性 能 调 优 是 一 种 为 改善 应 用 响应 性 
或 吞吐 量 而 更 改 参 数 (Tunable) 、 源 代码 或 属性 配置 的 活动 。 性 能 诉 
优 通 常 是 在 性 能 监控 或 性 能 分 析 之 后 进行 。 


生产 环境 中 应 该 自始至终 地 监控 应 用 JVM 端 。JVM 是 应 用 软件 的 
重要 组 成 部 分 ， 应 该 像 监 控 应 用 自身 和 操作 系统 那样 监控 JVM。 分 析 
JVM 监 控 数 据 ， 可 以 知道 何 时 需要 JVM 调 优 。JVM 版 本 变更 、 操 作 系 
统 变更 (配置 或 版 本 ) 、 应 用 版 本 更 新 ， 或 者 在 应 用 输入 发 生 重 大 变 
动 时 ， 应 该 考虑 JVM 调 优 。 由 于 JVM 的 输入 变化 而 影响 JVM 性 能 情 ) 
对 于 许多 Java 应 用 来 说 司空 见 惯 。 所 以 ,监控 JVM 非 常 重要 。 

JVM 的 监控 范围 包括 垃圾 收集 、JIT 编 译 以 及 类 加 载 。 


6.2.1 监控 垃圾 收集 目的 


在 JVM 编 译 期 和 和 加载 器 ， 甚 至 运行 期 已 经 做 了 大 量 的 调 优 操作 ， 
但 是 那些 都 是 JVM 针 对 Java 程 序 所 做 的 通用 的 、 简 单 的 优化 ， 程 序 在 运 
行 时 由 于 运行 环境 的 复杂 性 、 业 务 逻 辑 的 复杂 性 ， 很 多 JVM 是 无 法 进 
行 优化 处 理 的 ， 这 就 需要 我 们 自己 在 写 代码 的 时 候 就 注意 ， 以 便 我 们 
的 程序 在 特定 的 业务 场景 发 挥 到 最 佳 性 能 。 

笔者 觉得 监控 JVM 的 垃圾 收集 非常 重要 ， 因 为 它 对 应 用 的 吞吐 量 
和 延迟 有 着 深刻 的 影响 。 现 代 JVM， 如 HotSpot VM， 可 以 将 每 次 GC 的 
数据 直接 输出 成 日 志文 件 ， 以 文本 方式 查看 GC 统计 数据 ， 或 者 用 GUI 
监控 工具 查看 。 注 意 ，HotSpot VM 报告 垃圾 收集 数据 几乎 没有 什么 额 
外 开销 ， 建 议 在 生产 环境 中 使 用 。 

一 般 来 说 ， 垃 圾 收集 分 两 种 ， 即 次 要 垃圾 收集 (也 称 为 新 生 代 垃 
圾 收集 ， 以 下 称 为 Minor GC) 和 主要 垃圾 收集 (以 下 称 为 Full GC) o 
Minor GC 收集 新 生 代 ，Full GC 通常 会 收集 整个 堆 ， 包 括 新 生 代 、 老 年 
代 和 永久 代 ， 除 了 将 新 生 代 中 的 活跃 对 象 提 升 到 老年 代 之 外 ， 还 会 压 
缩 整 理 老 年 代 和 永久 代 。 因 而 Full GC 之 后 ， 新 生 代 为 空 ， 老 年 代 和 永 
久 代 也 已 压缩 整理 并 且 只 有 活跃 对 象 。 

如 果 各 项 参数 设置 合理 ， 系 统 没 有 超时 日 志 出 现 ，GC 频 率 不 高 ， 
GC 耗 时 不 高 ， 那 么 没有 必要 进行 GC 优化 ;如 果 GC 时 间 超 过 1~3 秒 ， 
或 者 频繁 GC， 则 必须 优化 。 如 果 满 足下 面 的 指标 ， 则 一 般 不 需要 进行 
GC: 

m Minor GC 执行 时 间 不 到 50ms，; 

m Minor GC 执行 不 频繁 ， 约 10 秒 一 次 ，; 


m Full GC 执 行 时 间 不 到 1s; 

m Full GC 执 行 频率 不 算 频 繁 ， 不 低 于 10 分 钟 1 次 。 

如 前 所 述 ，Minor GC 会 释放 新 生 代 中 不 可 达 对 象 所 占 的 内 存 。 相 
比 而 言 ，HotSpot VM 的 Full GC 会 释放 新 生 代 、 老 年 代 和 永久 代 中 不 可 
达 对 象 所 占 的 内 存 。 开 启 Minor GC 和 Full GC 有 多 种 方式 ， 例 如 开启 - 
XX: +UseParallelGC 或 -XX: +UseParallelOldGC 时 ， 如 果 关 闭 -XX: 
*ScavengeBeforeFullGC , HotSpot VM T£ Full GC 之 前 不 会 进行 Minor 
GC; 如 果 开 启 -XX: +ScavengeBeforeFullGC, HotSpot YM 在 Full GC 前 
会 先 做 一 次 Minor GC， 分 担 一 部 分 Full GC 原本 要 做 的 工作 ， 在 这 两 次 
独立 的 GC 之 前 Java 线 程 上 有 机 会 得 以 运行 ， 从 而 缩短 最 大 停顿 时 间 ， 但 
也 拉 长 了 整体 的 停顿 时 间 。 具 体 相关 内 容 我 们 会 在 第 7 章 介绍 。 

重要 的 垃圾 收集 数据 包括 : 

m 当前 使 用 的 垃圾 收集 器 ，; 

m Java 堆 的 大 小 ， 

E 新 生 代 和 老年 代 的 大 小 ， 

e KARA; 

m Minor GC 的 持续 时 间 ]; 

m Minor GC 的 频率 ; 

m Minor GC 的 空间 回收 量 ; 

m Full GC 的 持续 时 间 ; 

m Full GC 的 频率 ; 

每 个 并 发 垃圾 收集 周期 内 的 空间 回收 量 ，; 

m 垃圾 收集 前 后 Java 堆 的 占用 量 ，; 

m 垃圾 收集 前 后 新 生 代 和 老年 代 的 占用 量 ，; 

mu 垃圾 收集 前 后 永久 代 的 占用 量 ，; 

E 是 否 老年 代 或 永久 代 的 占用 触发 了 Full GC; 

a 应 用 是 否 显 式 调用 了 System.gc O o 


6.2.2 GC 垃圾 回收 报告 分 析 


我 们 可 以 通过 -verbosegc 来 打印 出 GC 的 日 志 。-verbosegc 是 一 个 比 
较 重 要 的 启动 参数 ， 记 录 每 次 gc 的 日 志 。 与 -verbosegc 配 合 使 用 的 一 些 
常用 参数 为 : 

m-XX: +PrintGCDetails， 打 EGC 人 信息， 这 是 -verbosegc 默 认 开 启 
的 选项 ; 

m-XX: +PrintGCTimeStamps, #JEN42RGCAYAYIAlEE ; 

m-XX: +PrintHeapAtGC: 每 次 GC 时 ， 打 印 堆 信息 ; 

m-XX: +PrintGCDateStamps (from JDK 6 update 4) : 打印 GC 日 
期 ， 适 合 于 长 期 运行 的 服务 器 ; 

m-Xloggc: /home/admin/logs/gc.log: 制定 打印 信息 的 记录 的 日 志 位 
置 。 


每 条 verbosegc 打 印 出 的 gc 上 日志， 都 类 似 于 下 面 的 格式 ， 如 清单 6-38 
所 示 。 


代码 清单 6-38 GC 日 志 格式 
time [GC [<collector>: «starting occupancyl> -><ending occupancyl>(total 
occupancyl), «pause timel> secs] «starting occupancy3> -><ending occupancy3> (total 


occupancy3), <pause time3> secs] 


例如 代码 清单 6-39 所 示 的 日 志 输出 ， 按 照 清单 6-36 所 示 的 格式 ， 具 
体 每 一 列 代表 的 意义 如 代码 清单 6-40 所 示 。 


代码 清单 6-39 GC 日 志 示例 

0.756: [FullGC(System) 0.756: [CMS: OK->1696K (204800K) ,0.0347096 secs]11488K->1696K (25260 
8K) , [CMSPerm: 10328K->10320K (131072K) ], 0.0347949secs] [Times:user-0.06sys-0.00, real-0.05sec 
s] 

1.728: [GC1.728: [ParNew: 38272K->2323K (47808K) ,0.0092276secs] 39968K->4019K (252608K) , 0.0 
093169secs] [Times:user-0.01sys-0.00, real=0.00secs] 

2.642: [GC2. 643: [ParNew: 40595K->3685K (47808K) ,0.0075343secs] 42291K->5381K (252608K) , 0.0 
075972secs] [Times:user-0.03sys-0.00, real=0.02secs] 

4,349: [GC4.349: [ParNew: 41957K->5024K (47808K) ,0.0106558secs] 43653K->6720K (252608K) ,0.0 
107390secs] [Times :user-0.03sys70.00, real=0.02secs] 

5.617: [GC5. 617: [ParNew: 43296K->7006K (47808K) ,0.0136826secs] 44992K->8702K (252608K) , 0. 0 
137904secs] [Times :user=0.03sys=0.00, real=0.02secs] 

7.429: [6C7.429: [ParNew:45278K->6723K (47808K) ,0.0251993secs] 46974K->10551K (252608K) , 0. 
0252421secs] 


代码 清单 6-40 GC 日 志 格式 解释 
time (Tit): 执行 GC 的 时 间 ， 需 要 添加 -XX:+PrintGCDateStamps KAT A; 
collector: Minor gc 使 用 的 收集 器 的 名 字 ; 
starting occupancyl: GC 执行 前 新 生 代 空 间 大 小 ; 
ending occupancyl: CC 执行 后 新 生 代 空间 大 小 ; 
total occupancy1， 新 生 代 总 大 小 ; 
pause timel: 因为 执行 minor GC, Java ER EAE RT]; 
starting occupancy3: GC 执行 前 堆 区 域 总 大 小 ， 
ending occupancy3: GC 执行 后 堆 区 域 总 大 小 ; 
total occupancy3: 推 区 总 大 小 ; 
pause time3; Java 应 用 由 于 执行 堆 室 间 GC ( 包括 full GC) 而 停止 的 时 间 。 


根据 6-40 的 每 个 字段 意义 ， 清 单 6-39 对 应 的 倒数 第 二 条 信息 翻译 过 
来 ， 如 代码 清单 6-41 所 示 。 


代码 清单 6-41 倒数 第 二 行 意义 

5.617 (RR) : [GC ( ee GC) 5.617 (WIA ) : [ParNew (GC 的 区 域 ) :43296K (AEK H 
大 小 ) ->7006K (垃圾 回收 以 后 的 大 小 ) (47808K) ( 该 区 域 总 大 小 ) ,0.0136826secs ( 回收 时 间 ) ] 44992K 
( 推 区 垃圾 回收 前 的 大 小 ) ->8702K enim (252608K) ( 堆 区 总 大 小 ) ,0.0137904secs 
(回收 时 间 ) ] [Times:user=0.03 (GC ffl PHA ) sys=0.00 (GC 系统 耗 时 ) ,real=0.02secs (GC 2# 
时 ) | 


从 最 后 一 条 GC 记录 中 我 们 可 以 看 到 Young GC 回收 了 45278- 
6723=38555KB 的 内 存 ，Heap 区 通过 这 次 回收 总 共 减少 了 46974- 
10551=36423KB 的 内 存 。38555-36423=2132KB 说 明 通 过 该 次 Young GC 
有 2132KB 的 内 存 被 移动 到 了 Old Geno 


6.2.3 图 形 化 工具 


离线 分 析 是 为 了 汇总 垃圾 收集 数据 并 从 中 查找 重要 的 数据 模式 。 
垃圾 收集 数据 的 离线 分 析 方 法 有 多 种 ， 例 如 将 数据 载 入 电子 表格 或 者 
图 表 工 具 。 

6.2.3.1 GCHisto 

GCHisto 是 一 个 离线 分 析 工 具 ， 它 从 文件 读 入 垃圾 收集 数据 ， 以 表 
格 和 图 形 化 方式 展现 ， 如 图 6-15 所 示 。 


Trace Management | GC Pause Stats | GC Pause Distribution | GC Timeline 


| AI GC Stats | Chart Num | Chart: Total GC (sec) Chart Avg (ms) | Chart Sigma (ms) Chart Min (ms) Chart: Max (ms) 
| 


Num Num (*) Total GC on Total GC (%) | Overhead (%) dr Sigma (ms) Min (ms) Max (ms) | 

An 994 100 0094 147 100 0094 028956 5238 25 888 $877 700.76 

Young GC $992 $9 8056 d 690 96.90% 02896 id 808 z2 120 9877 TOO 76 

| Full Gc 6 6.00% 0.000 0.00% 0.00% 0.000 0.000 6.000 0.00 
Initial Mark 1 0.1096 0.017 0.11% 0.00% 17.041 0.000 17.041 17.041 
Remark 1 0 1056 6.440 2919 60156 440.075 6000 440.075 440.075 


图 6-15 GCHisto 剪 切 图 


GC Pause Stats TAB 页 显示 了 垃圾 收集 的 次 数 、 开 销 和 持续 时 间 
它 的 子 选 项 卡 逐 项 集中 展示 这 些 数据 。 所 有 5 引入 Stop-The-World 停 


m 


顿 的 垃圾 收集 ， 在 表 中 都 会 占用 一 行 ， 最 上 面 一 行 是 总 计 。 

垃圾 收集 的 开销 (Overhead%) 表示 垃圾 收集 调 优 的 程度 。 作 为 一 
般 性 准则 ， 并 发 垃圾 收集 的 开销 应 该 小 于 10%， 也 有 可 能 达到 1%-3%。 
对 Throughput 收 集 器 来 说 ， 如 果 垃 圾 收集 的 开销 接近 1%， 说 明 垃 圾 收 
集 器 调 得 很 好 ，3% 或 更 高 则 说 明 调 优 可 以 改善 应 用 的 性 能 。 重 要 的 是 
理解 垃圾 收集 开销 和 Java 堆 大 小 之 间 的 关系 ，Java 堆 越 大 ， 降 低 垃圾 收 
集 开 销 的 机 会 越 大 。 对 于 给 定 的 Java 堆 大 小 ， 通 过 JVM 调 优 才 能 达到 最 
小 的 开销 。 

最 长 停顿 时 间 (Maximum Pause Time) ， 可 以 用 来 评估 最 差 情 况 
下 垃圾 收集 的 延 时 是 否 满足 要 求 。 最 长 停顿 时 间 超 过 应 用 需求 时 ， 
JVM 可 能 需要 调 优 ， 至 于 是 否 有 必要 ， 则 由 其 超过 的 程度 和 超出 的 停 
顿时 间 决 定 。 

默认 时 ，GC Pause Distribution 显 示 所 有 垃圾 收集 停顿 的 分 布 ，x 轴 
是 垃圾 收集 的 停顿 时 间 ，y 轴 是 停顿 的 次 数 。 单 独 查 看 Full GC 通常 更 有 
用 ， 因 为 一 般 来 说 它 的 时 间 最 长 。 只 看 Young GC 可 以 了 解 停 顿时 间 的 
变化 分 布 。 停 顿时 间 分 布 广 ， 说 明 对 象 分 配 率 和 提升 率 的 波动 大 。 如 
果 发 现 这 种 情况 ， 你 应 该 查看 GC Timeline ， 找 到 垃圾 收集 活动 的 峰 
值 。 

默认 时 ，GC Timeline 显 示 整 个 时 间 线 上 所 有 垃圾 收集 的 停顿 。 

6.2.3.2 JConsole 

JConsole 是 一 个 JMX (Java Management Extensions) 兼容 的 GUI 工 
具 ， 可 以 连接 运行 中 的 Java5 或 者 更 高 版 本 的 JVM。 用 Java5 JVM 启 动 
Java 应 用 时 ， 命 令 行 只 有 添加 -Dcom.sun.management.jmxremote , 
JConsole 才 能 连接 ， 而 Java6 或 更 高 版 本 的 JVM 不 需要 添加 此 属性 。 

JConsole 可 以 以 三 种 方式 连接 正在 运行 的 JVM : 

m Local: 使 用 JConsole 连 接 一 个 正在 本 地 系统 运行 的 JVM， 并 且 执 
行程 序 的 和 运行 JConsole 的 需要 是 同一 个 用 户 。JConsole 使 用 文件 系统 
的 授权 通过 RMI 连 接 器 连接 到 平台 的 MBean 服 务 器 上 。 这 种 从 本 地 连接 
的 监控 能 力 只 有 Sun 的 JDK 具 有 。 

m Remote: 使 用 下 面 的 URL 通过 RMI 连接 器 连接 到 一 个 JMX fX 
JH, service: jmx: rmi: ///jndi/rmi: //hostName: portNum/jmxrmi o 


hostName 填 入 主机 名 称 ，portNum 为 JMX 代理 启动 时 指定 的 端口 。 
JConsole 为 建立 连接 ， 需 要 在 环境 变量 中 设置 mx.remote.credentials 来 指 
定 用 户 名 和 密码 从 而 进行 授权 ; 

m Advanced: 使 用 一 个 特殊 的 URL 连 接 JMX 代 理 。 一 般 情况 使 用 
自己 定制 的 连接 器 而 不 是 RMI 提 供 的 连接 器 来 连接 JMX 代 理 ， 或 者 是 
一 个 使 用 JDK1.4 的 实现 了 JMX 和 JMX Rmote 的 应 用 。 

JConsole 工 具 在 JDK/bin 目 录 下 ， 启 动 JConsole 后 ， 将 自动 搜索 本 机 
运行 的 jvm 进 程 ， 不 需要 jps 命 令 来 查询 指定 。 双 击 其 中 一 个 jvm 进 程 即 
可 开始 监控 ， 也 可 使 用 “远程 进程 > 来 连接 远程 服务 器 ， 如 图 6-16 所 示 。 


[ 连接 | [ 取消 | 


图 6-16 登录 JConsole 


进入 JConsole 主 界面 ， 有 “概述 "、“ 内 存 "、“ 线 程 "、“ 类 "、“VM 摘 
要 ”和 “Mbean” 等 六 个 选项 卡 (TAB 页 ) ， 如 图 6-17 所 示 。 


连接 窗口 帮助 
rate | 4442 | 2 | vm 摘要 | MBean 
时 间 范围 ; 


100 Mb + 
21:16 21:17 21:16 21:17 


已 合用: 141.4 Mb PRS: 523.5 Mb 最 大 入: 523.5 Wb 活动 : 32 WIA: 36 Sit: i14 


CPU 使 用 情况 
3.087 


R 


20, 000 7 


-一 一 -一 
21:16 21:17 


Sit: 13,815 CPU 使 用 情况 : 0. 1% 


Phi: 13,815 未 加 载 : 0 


图 6-17 JConsole 主 界面 
概要 选项 卡 显示 了 关于 线程 使 用 、 内 存 消耗 和 class 加 载 的 一 些 关 
键 监视 信息 ， 以 及 JVM 和 操作 系统 的 信息 。 其 中 Uptime 代 表 JVM 已 运 
行 时 长 ，Total compile time 代 表 花 费 在 即时 编译 (JIT compilation) 中 
的 时 间 ，Process CPU ae inate 间 。 
内 存 选 项 卡 相当 于 jstat 命 令 ， 用 于 监视 收集 器 管理 的 虚拟 机 内 存 
(Javit KAR) 变化 趋势 ， 人 esu uti 
时 间 及 次 数 ， 如 图 6-18 所 示 。 


SORTEM pid : 4564 
(jig BD em 
| 概述 | 内 存 | 线程 | 类 | mm 3D 

Ek: HRRRÉRS + wate: $8 + 


200 Mb 7 


[GC 时 间 : Copy (38 项 收集 ) 所 用 的 时 间 为 1.10 3» 
MarkSweepCompact (0 项 收集 ) 所 用 的 时 间 为 


图 6-18 内 存 TAB 页 

已 使 用 代表 当前 使 用 的 内 存 总 量 。 使 用 的 内 存 总 量 是 指 所 有 的 对 
象 占用 的 内 存 ， 包 括 可 达 和 不 可 达 的 对 象 。 

分 配 代表 JVM 可 使 用 的 内 存量 。Committed 内 存 数 量 可 能 随时 间 变 
化 而 变化 。JAVA 虚拟 机 可 能 将 某 些 内 存 释 放 ， 还 给 操作 系统 ， 
committed 内 存 可 能 比 启动 时 初始 分 配 的 内 存量 要 少 。Committed 内 存 总 
是 大 于 等 于 used 内 存 。 

最 大 值 代 表 内 存 管 理 可 用 的 最 大 内 存 数 量 。 此 值 可 能 改变 或 者 为 
未 定义 。 如 果 JVM 试 图 增加 使 用 内 存 (used memory) 超出 了 committed 
内 存 ， 那 么 即时 使 用 内 存 小 于 或 者 等 于 最 大 内 存 (比如 系统 虚拟 内 存 
较 低 ) ， 内 存 分 配 仍 可 能 失败 。 


线程 选项 卡 ， 如 图 6-19 所 示 ， 其 中 Live threads 代 表 当 前 活动 的 
daemon 线 程 加 non-daemon 线 程 数 量 。Peak 代 表 自 JVM 启 动 后 ， 活 动 线 
程 峰值 。Daemon threads 代 表 当 前 活动 的 Daemon 线 程 数 量 。Total started 
代表 自 JVM 启 动 后 ， 启 动 的 线程 总 量 (包括 daemon，non-daemon 和 终 
止 了 的 ) o 
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图 6-19 线程 TAB 页 
最 后 一 个 常用 选项 卡 是 VM 选 项 卡 ， 可 清楚 地 了 解 显示 指定 的 JVM 
参数 及 堆 信 息 ， 如 图 6-20 所 示 。 


VM RE 
2012 年 10 月 日 星期 二 下午 09 时 35 分 04 种 CST 


连接 名 称 : pid: 4568 正常 运行 时 间 : 2 hours 24 minutes 
虐 拟 机 : Java HotSpot(TM) Client VM 版 本 20.10-b01 处 理 CPU 时 间 : 1 minute 
供应 商 : Sun Microsystems Inc. JIT 编译 器 : HotSpot Client Compiler 
名 称 : 4564@admin-PC 编译 总 时 间 : 29693 


活动 线程 : x 当前 类 已 装 入 : 13,816 
i: 3 已 装 入 类 的 总 数 : 12,816 
守护 线程 : m 已 郑 载 类 的 总 数 : 
已 启动 的 线程 总 数 :19 


当前 扒 大 小 : 185, 333 Kb 分 配 的 内 存 : 511, 232 Kb 
推 太 小 的 最 大 值 : 511,232 Kb 暂 挂 结束 操作 : 0418 
垃圾 收集 强 : Name = ‘Copy’, Collections = 38, Total time spent = 1.140 种 
垃圾 收集 器 : Name = MarkSweepCompact, Collections = 0, Total time spent = 0.000 
i) 


操作 系统 : Windows 76.1 物理 内 存 总 量 ; 4 098, 764 Kb 

体系 结构 : 196 可 用 物理 内 存 : 1, 421, 108 Kb 

处 理 器 的 数目 : 4 交换 空间 总 量 ; 4, 194, 303 Kb 
分 配 的 虚拟 内 存 : 749, 628 Kb 可 用 交换 空间 : 4, 194, 303 Kb 


M 参数 : -Dosgi requiredJavaVersion-1.5 -Xms512m -Xmx512m -Xmn128m -XX-PermSize=96m -XX:MaxPermSize=132m -Xnoclassge -XX-«UseParNewGc -XX: 
*UseConcMarkSweepGc -XX:CMSinitiatingOccupancyF raction=85 -XX:+PrintGCApplicationStoppedTime -XX-* Print GCDetails -XX-*PrintGCTimeStamps -XX: 


类 路 径 : C: java eclipse plugins org eclipse equinox launcher. 1.0.100.20080509-1800.jar 
java eclipse plugins org eclipse equin d j 
库 路 径 : C:javaeclipse;C: Windows Sun Java bin;C: Windows system32,C: Windows;C: java jdk1.6.0. 35/bin...jre'binclient;C: java jdk1.6.0. 35/bin/. jre'bin.C: 


图 6-20 VM 信息 TAB 页 
6.2.3.3 VisualVM 
VisualVM 是 一 个 集成 多 个 JDK 命 令 行 工 具 的 可 视 化 工具 。 
VisualVM 基 于 NetBeans 平 台 开 发 ， 它 具备 了 插件 扩展 功能 的 特性 ， 通 
过 插件 的 扩展 ， 可 用 于 显示 虚拟 机 进程 及 进程 的 配置 和 环境 信息 
(jps, jinfo) ， 监 视 应 用 程序 的 CPU、GC、 堆 、 方 法 区 及 线程 的 信息 
(jstat、jstack) 等 。VisualVM 在 JDK/bin 目 录 下 。VisualVM 主 界面 如 
6-21 所 示 。 
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应 用 程序 A) NAV IAD EX) 帮助 (H) 
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ED 
apa 


S& HANGAR (id 4564) X|W Visual X 


© 《未 知 的 应 用 程序 》 (pid 4564) 
概述 


PID: 4564 
主机 : localhost 
主 类 : GERD 
Sh: 《无 > 


JV: Java HotSpot (IM) Client VM (20.10-b01, mixed mode, sharing) 
Java: 版 本 1.6.0_35， 供 应 商 Sun Microsystems Inc. 
Java Home 目录 : C: \java\jdkl.6.0_35\jre 


回 保存 的 数据 Vl RES 


Im 标志 : 元 > 
出 现 OONE 时 生成 堆 dump: 禁用 
保存 的 数据 x | Jm 参数 | 系统 属性 | TW capabilities 
线程 Dup: 0 -Dosgi.requiredJsvsVersion-l.5 
JË Dump: 0 -Ims512m 
Profiler YH: 0 -Imx512m 
7lnni28n 
-Il:PernSize-96n 
711: MaxPernSi ze=132m 
7Inoclsssgc 
-II: HüseParBeuGc 
II: +UseC onc arkSweepGe 


~IT: CWSIni tiating0ccupancyFraction=85 
II: +PrintGCApplicationStoppedTime 
II: +PrintGCDetails 

II: +PrintGCTimeStamps 

-II: +PrintHeapAtGe 
-II:+PrintFlagsFinal 

-Iloggc: c: \java\ge. log 


图 6-21 VisualVM 主 界面 


使 用 前 我 们 需要 安装 插件 ， 如 图 6-22 所 示 。 
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-IX :+PrintHeapAtGC 
-II:HPrintFlagsFinsl 
-Iloggc: c: \java\ge. log 


图 6-22 VisualVM 安 装 


在 VisualVM 中 生成 Dump 文 件 ， 如 图 6-23 所 示 。 


4 VisualVM 1.3.3. "Uu 
文件 (月 应 用 程序 (A) WAV IAM SOW 帮助 (H) 
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线程 Dump(T) X | Graphs x 
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Compile Time: 3585 compiles - 3.019s 
应 用 程序 快 昭 (A) 


|| 
Class Loader Time: 12927 loaded, 0 unlosded - 27.822s 
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在 出 现 OOME 时 生成 堆 Dump(E) | 


GC Time: 40 collections, 1.838s Lest Cause: Heep Dump Initiat | 
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Trace application... | Nu Eden Space (102.5008, 102.5008): 48.784N, 39 collections, 1.18 || 
| 
| 天 qq 


属性 中 Survivor 0 (12.750N, 12.750N): 0 


S0 Survivor 1 (12.7508, 12.7508): 0 | 
Old Gen (384. 000W, 384.000N): 92.6728, 1 collections, 657.062m || 
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图 6-23 VisualVM 生 成 Dump 文 件 
6.2.4 GC 跟 踪 示 例 


6.2.4.1 示例 一 

笔者 发 现 了 部 分 开发 测试 机 器 出 现 异 常 ， 异 常 信 息 为 
*java.lang.OutOfMemoryError: GC overhead limit exceeded”. XSF 
前 半 部 分 可 以 理解 为 堆 内 存 不 足 ， 后 半 部 分 理解 为 GC 为 了 释放 很 小 的 
空间 却 耗费 了 太 多 的 时 间 。 造 成 这 个 异常 的 原因 可 能 有 两 个 ， 一 是 可 
能 堆 内 存 设 置 太 小 ， 二 是 代码 中 存在 死 循环 或 反复 创建 大 对 象 的 可 能 
性 存在 。 笔 者 首先 排除 了 第 2 个 原因 ， 因 为 这 个 应 用 同时 是 在 线 上 运行 
的 ， 如 果 有 问题 ， 系 统 启动 的 时 候 就 应 该 出 现 问题 。 所 以 怀疑 是 这 从 
机 器 中 堆 内 存 设置 太 小 造成 了 最 终 的 问题 。 


使 用 ps-eflgrep " java“ 查看， 返回 结果 显示 -Xms800m， 即 该 应 用 
的 堆 区 设置 只 有 800m， 而 机 器 内 存 有 20GB ， 机 器 上 只 运行 了 这 人 么 一 
个 java 应 用 ， 没 有 其 他 需要 占用 内 存 的 地 方 。 另 外 ， 这 个 应 用 比较 
大 ， 需 要 占用 的 内 存 也 比较 多 。 笔 者 通过 上 面 的 情况 判断 ， 只 需要 改 
变 堆 中 各 区 域 的 大 小 设置 即 可 ， 将 内 存 设置 为 4GB 后 ， 相 关 异 常 没 
再 次 出 现 。 

6.2.4.2 示例 二 

一 个 大 型 服务 系统 如 果 经 常 出 现 卡 顿 ， 那 我 们 就 需要 考虑 Stop the 
World 情 况 的 发 生 可 能 性 了 ， 即 是 否 发 生 Full GC 时 间 太 长 的 情况 。 

通过 jstat-gcutil 命 令 可 以 查看 GC 情况 ， 如 清单 6-42 所 示 。 


代码 清单 6-42 JSTAT 输出 GC 情况 
S0S1 E O P YGC YGCT FGC FGCT GCT 
12.16 0.00 5.18 63.78 20.32 54 2.047 5 6.946 8.993 


分 析 上 面 的 数据 ， 发 现 Young GC 执 行 了 54 次 ， 耗 时 2.047 秒 ， 每 次 
Young GC 耗 时 37ms， 在 正常 范围 ， 而 Full GC 执行 了 5 次 ， 耗 时 6.946 
秒 ， 每 次 平均 1.389s。 

清单 6-40 数 据 显 示 出 来 的 问题 是 Full GC 耗 时 较 长 ， 分 析 该 系统 的 
是 指 发 现 ，NewRatio=9， 也 就 是 说 ， 新 生 代 和 老生 代 大 小 之 比 为 
1 : 9， 这 就 是 问题 的 原因 : 

(1) 新 生 代 太 小 ， 导 致 对 象 提前 进入 老年 代 ， 触 发 老年 代 发 生 
Full GC; 
(2) 老年 代 较 大 ， 进 行 Full GC 时 耗 时 较 大 ，; 

优化 的 方法 是 调整 NewRatio 的 值 ， 调 整 到 4， 发 现 Full GC 没有 再 发 
生 ， 只 有 Young GC 在 执行 。 这 就 是 把 对 象 控制 在 新 生 代 就 清理 掉 ， 没 
有 进入 老年 代 (这 种 做 法 对 一 些 应 用 是 很 有 用 的 ， 但 并 不 是 对 所 有 应 
用 都 要 这 么 做 ) 。 


6.3 本 章 小 结 


本 章 首 先 对 计算 机 设备 层面 ， 例 如 CPU、 内 存 、 硬 盘 、 网 络 等 的 
使 用 情况 检测 方式 进行 了 描述 ， 列 举 了 一 系列 可 用 的 工具 及 详细 用 
法 ， 接 下 来 介绍 了 JVM 监 控 的 一 些 常用 工具 及 具体 使 用 方法 ， 然 后 对 
操作 系统 层面 的 一 些 有 用 的 数据 ， 例 如 进程 、 线 程 、 锁 竞争 、 运 行 时 
信息 等 打印 方法 进行 了 阐述 。 

[1) 又 称 机 器 周期 ， 机 器 内 部 各 种 操作 大 致 可 归属 为 对 CPU 内 部 的 操作 和 对 主 存 的 操作 两 大 类 ， 由 于 CPU 内 部 操作 速度 较 


快 ，CPU 访 问 一 次 内 存 所 花 的 时 间 较 长 ， 因 此 用 从 内 存 读 取 一 条 指令 字 的 最 短 时 间 来 定义 ， 这 个 基准 时 间 就 是 CPU 周 期 
(机 器 周期 ) 。 一 个 指令 周期 常 由 若干 CPU 周期 构成 。 


[2] 本 书 指使 用 了 与 CPU 不 一 样 的 GPU 的 机 器 。 


第 7 章 JVM 性 能 调 优 建议 


宇宙 是 广 鹿 空间 和 其 中 存在 的 各 种 天 体 以 及 弥漫 物质 的 总 称 。 宇 
宙 起 源 是 一 个 极其 复杂 的 问题 。 宇 宙 是 物质 世界 ， 它 处 于 不 断 的 运动 
和 发 展 中 。 王 百年 来 ， 科 学 家 们 一 直 在 探寻 宇宙 是 什么 时 候 、 如 何 形 
成 的 。 直 到 今天 ， 许 多 科学 家 认为 ， 宇 宙 是 由 大 约 137 亿 年 前 发 生 的 一 
次 大 爆炸 形成 的 。 宇 宙 内 的 所 存 物质 和 能 量 都 聚集 到 了 一 起 ， 并 浓缩 
成 很 小 的 体积 ， 瘟 度 极 高 ， 密 度 极 大 ， 上 退 间 产生 巨大 压力 ， 之 后 发 生 
了 大 爆炸 ， 这 次 大 爆炸 的 反应 原理 被 物理 学 家 们 称 为 量子 物理 。 大 爆 
炸 使 物质 四 散 出 去 ， 宇 宙 空 间 不 断 膨胀 ， 温 度 也 相应 下 降 ， 后 来 相继 
出 现在 宇宙 中 的 所 有 星系 、 恒 星 、 行 星 乃 至 生命 。 程 序 设 计 优 化 就 好 
像 宇宙 起 源 探索 一 样 ， 你 不 了 解 起 源 ， 你 就 不 可 能 找到 正确 的 方法 。 

JVM 是 Java 语 言 可 以 跨 平台 、 保 持 高 发 展 的 根本 ,没有 了 JVM， 
Java 语 言 将 失去 运行 环境 。 针 对 Java 程 序 的 性 能 优化 一 定 不 可 能 避免 针 
对 JVM 的 调 优 ， 随 着 JVM 的 不 断 发 展 ， 我 们 的 应 对 措施 也 在 不 断 地 跟 
随 、 变 化 。 

本 章 主要 介绍 和 解决 以 下 问题 ， 这 也 是 本 书 的 最 核心 技术 点 : 

m JVM 的 基础 架构 、 生 命 周 期 是 什么 。 

m JVM 如 何 对 内 部 进行 管理 。 

m 垃圾 收集 器 内 部 原理 。 

m 常用 的 JVM 参 数 使 用 及 测试 结果 。 

m 如何 基 于 JVM 对 程序 调 优 。 


7.1 JVM 相 关 概 念 


Java 语 言 的 一 大 特点 就 是 可 以 进行 自动 垃圾 回收 处 理 ， 而 无 须 开 发 
人 员 过 于 关注 系统 资源 ， 例 如 内 存 资源 的 释放 情况 。 自 动 垃圾 收集 虽 
然 大 大 减轻 了 开发 人 员 的 工作 量 ， 但 是 也 增加 了 软件 系统 的 负担 。 

拥有 垃圾 收集 器 可 以 说 是 Java 语 言 与 C++ 语 言 的 一 项 显著 区 别 。 在 
C++ 语 言 中 ， 程 序 员 必 须 小 心 谨慎 地 处 理 每 一 项 内 存 分 配 ， 且 内 存 使 用 


完 后 必须 手工 释放 曾经 占用 的 内 存 空间 。 当 内 存 释 放 不 够 完全 时 ， 即 
存在 分 配 但 永 不 释放 的 内 存 块 ， 就 会 引起 内 存 泄漏 ， 严 重 时 导致 程序 
瘫痪 。 本 节 我 们 先 来 了 解 一 下 JVM 的 内 存 分 配 及 使 用 策略 ， 这 一 点 已 
经 在 第 2 章 重 点 描述 过 ， 所 以 这 里 不 会 过 多 阐述 ， 接 下 来 会 针对 字 节 
码 、 自 动 内 存 管理 机 制 进行 叙述 ， 这 些 知识 都 是 为 了 后 面 的 几 个 子 章 
节 做 知识 积累 的 。 


7.1.1 内 存 使 用 相关 概念 


7.1.1.1 内 存 分 配 意义 

内 存在 计算 机 世界 里 占据 着 至 关 重 要 的 地 位 ， 任 何 运行 时 的 程序 
或 者 数据 都 需要 依靠 内 存 作为 存储 介质 ， 否 则 程序 将 无 法 正常 运行 。 
与 C/C++ 语 言 相 比 ， 使 用 Java 语 言 编 写 的 程序 并 不 需要 显 式 地 为 每 一 个 
对 象 都 编写 对 应 的 内 存 分 配 和 内 存 回 收 等 相关 函数 ， 这 主要 是 得 益 
JVM 的 自动 内 存 管理 机 制 ， 使 得 Java 开 发 人 员 可 以 从 烦琐 的 体力 劳动 中 
解放 出 来 ， 只 需 关 注 于 自身 业务 即 可 。 

尽管 JVM 的 自动 内 存 管理 机 制 大 大 提升 了 Java 开 发 人 员 的 编程 效 
率 ， 甚 至 从 某 种 意义 上 来 说 还 降低 了 内 存 泄 露 和 内 存 溢出 的 风险 ， 但 
是 如 果 Java 开 发 人 员 过 度 依赖 于 自动”， 那 么 这 将 会 是 一 场 灾难 ， 最 严 
重 的 可 能 性 就 是 会 弱化 Java 开 发 人 员 在 程序 出 现 内 存 溢出 时 定位 问题 和 
解决 问题 的 能 力 ， 事 实 上 也 确实 如 此 ， 我 在 工作 当中 实际 带领 Java 和 
C++ 两 个 小 组 进行 开发 工作 ，C++ 程 序 员 的 内 存 管理 意识 明显 较 Java 程 
序 员 强 。 

JVM 内 部 定义 了 多 个 程序 在 运行 时 需要 使 用 到 的 内 存 区 。JVM 的 
设计 者 们 之 所 以 会 选择 将 JVM 的 内 存 结构 划分 为 多 个 不 同 的 内 存 区 ， 
究 其 根本 原因 是 因为 每 一 个 独立 的 内 存 区 都 拥有 各 自 的 用 途 ， 都 会 负 
责 存 储 各 自 的 数据 类 型 。 其 中 一 些 内 存 区 的 生命 周期 往往 还 会 和 JVM 
的 生命 周期 保持 一 致 ， 也 就 是 说 ， 会 伴随 着 JVM 的 启动 而 创建 ， 伴 随 
着 JVM 的 退出 而 销毁 。 而 另 一 部 分 内 存 区 则 是 与 线程 的 生命 周期 保持 
一 致 ， 会 伴随 着 线程 的 开始 而 创建 ， 伴 随 着 线程 的 消亡 而 销毁 。 尽 管 
不 同 的 内 存 区 在 存储 类 型 和 生命 周期 上 有 一 定 区 别 ， 却 都 拥有 一 个 相 
同 的 本 质 ， 那 就 是 存储 程序 的 运行 时 数据 。 这 一 节 的 内 容 第 2 章 已 经 介 
绍 过 ， 这 里 不 多 做 介绍 ， 只 是 让 大 家 能 够 回忆 起 来 。 


JVM 中 的 内 存 区 可 以 根据 受 访 权限 的 不 同 定义 为 线程 共享 和 线程 
私有 两 大 类 。 

7.1.1.2 线程 共享 内 存 区 

所 谓 线程 共享 指 的 就 是 可 以 允许 被 所 有 的 线程 共享 访问 的 一 类 内 
存 区 ， 包 括 堆 区 、 方 法 区 和 运行 时 常量 池 三 个 内 存 区 。 

四 Java 堆 区 

Java 堆 区 在 JVM 启 动 的 时 候补 创建， 并且 它 在 实际 的 内 存 空间 中 可 
以 是 不 连续 的 。Java 堆 区 是 一 块 用 于 存储 对 象 实 例 的 内 存 区 ， 同 时 也 是 
GC (Garbage Collection ， 垃 圾 收集 器 ) 执行 垃圾 回收 的 重点 区 域 。 
为 Java 堆 区 是 GC 的 重点 回收 区 域 ， 所 以 GC 极 有 可 能 会 在 大 内 存 [] 的 使 
用 和 回收 上 成 为 性 能 瓶颈 。 为 了 解决 这 个 问题 ，JVM 的 设计 者 们 开始 
考虑 是 否 一 定 需要 将 对 象 实例 存储 到 Java 堆 区 内 。 

基于 OpenJDK 深 度 定 制 的 TaoBaoVM ， 其 中 创新 的 GCIH (GC 
invisible heap) [2] 技 术 实 现 off-heap ， 将 生命 周期 较 长 的 Java 对 象 从 
Heap 中 移 至 Heap 之 外 ， 并 且 GC 不 能 管理 GCIH 内 部 的 Java 对 象 ， 以 此 达 
到 降低 GC 的 回收 频率 和 提升 GC 的 回收 效率 的 目的 。 在 某 些 特殊 的 应 用 
中 有 大 量 生命 周期 很 长 的 对 象 ， 在 应 用 运行 的 整个 过 程 中 它们 都 存 
在 ， 不 需要 被 GC 回收 。 如 果 这 类 对 象 很 多 ， 总 体 占 用 内 存 比例 高 ， 
那么 他 们 的 存在 将 给 GC 带 来 很 多 不 必要 的 工作 负担 。 假 设 在 淘宝 的 
很 多 应 用 中 都 具有 大 量 的 重复 对 象 ， 据 说 这 些 对 象 已 经 占用 超过 数 百 
MB 内 存 ， 它 们 本 身 在 应 用 提供 服务 前 创建 ， 在 服务 过 程 中 永远 存在 。 
那么 实际 在 GC 的 收集 工作 中 针对 这 些 对 象 的 所 有 访问 、 操 作 其 实 都 
是 “无 用 功 ”。 如 果 我 们 把 这 些 对 象 从 Java 堆 内 移动 到 堆 外 ， 那 么 这 些 
对 象 所 占用 的 Java 扒 内 空间 将 被 释放 ，GC 的 工作 量 将 会 降低 ， 从 而 每 
次 Full GC 的 时 间 将 会 缩短 。 除 此 以 外 ， 目 前 JVM 间 没有 很 高 效 的 内 存 / 
对 象 共 享 技术 ，GCIH 为 在 JVM 间 共享 内 存 / 对 象 提 供 了 必要 的 基础 。 通 
过 这 种 技术 可 以 将 那些 移动 到 GCIH 内 对 象 在 JVM 间 共享 ， 从 而 减少 内 
存 的 总 体 占 用 。 除 此 之 外 ， 逃 锡 分 析 与 栈 上 分 配 等 优化 技术 同样 也 是 
降低 GC 回收 频率 和 提升 GC 回收 效率 的 一 种 方式 ， 这 样 一 来 ，Java 堆 区 
就 不 再 是 Java 对 象 内 存 分 配 的 唯一 选择 了 。 

存储 在 JVM 中 的 Java 对 象 可 以 被 划分 为 两 类 : 一 类 是 生命 周期 较 短 
的 瞬时 对 象 ， 这 类 对 象 的 创建 和 消亡 都 非常 迅速 ， 而 另外 一 类 对 象 的 


命 周 期 却 非常 长 ， 在 某 些 极端 的 情况 下 还 能 够 与 JVM 的 生命 周期 保 
持 一 致 。 因 此 ， 对 于 这 些 不 同 生 命 周 期 的 Java 对 象 ， 应 该 来 取 不 同 的 垃 
圾 收集 策略 ， 分 代 收 集 由 此 诞生 。 目 前 几乎 所 有 的 GC 都 是 用 分 代 收 集 
算法 (关于 分 代 收 集 算法 请 阅读 7.3.2 节 ) ， 所 以 Java 堆 区 如 果 要 进一步 
细 分 的 话 ， 还 可 以 划分 为 新 生 代 (YoungGen) MEFR (OldGen) , 
其 中 新 生 代 又 可 以 划分 为 Eden 空 间 、From Survivor 空 间 和 To Survivor 空 
间 。 

既然 Java 堆 区 用 于 存储 Java 对 象 实 例 ， 那 么 堆 的 大 小 在 JVM 启 动 时 
就 已 经 设 定好 了 ， 大 家 可 以 通过 选项 “-Xmx” 和 “-Xms” 来 进行 设置 。 其 
中 选项 <-Xms” 用 于 表示 堆 区 的 起 始 内 存 ， 而 选项 <-Xmx” 则 用 于 表示 堆 
区 的 最 大 内 存 。 一 旦 堆 区 中 的 内 存 大 小 超过 “-Xmx” 所 制定 的 最 大 内 存 
时 ， 将 会 抛 出 OutOfMemoryError 异 常 。 

四 方法 区 

方法 区 和 Java 扒 区 一 样 ， 同 样 也 是 允许 被 所 有 的 线程 共享 访问 。 方 
法 区 中 存储 了 每 一 个 Java 类 的 结构 信息 ， 比 如 : 运行 时 常量 池 、 字 段 和 
方法 数据 、 构 造 遂 数 和 普通 方法 的 字 节 码 内 容 以 及 类 、 实 例 、 接 口 初 
始 化 时 需要 用 到 的 特殊 方法 等 数据 。 尽 管 Java 虚 拟 机 规范 对 方法 区 的 具 
体 实现 方式 并 没有 明确 要 求 ， 但 是 在 HotSpot 中 ， 方 法 区 仪 仪 只 是 逻辑 
上 的 独立 ， 实 际 上 还 是 被 包含 在 Java 扒 区 内 ， 也 就 是 说 ， 方 法 区 在 物理 
上 属于 Java 扒 区 的 一 部 分 。 

方法 区 在 JVM 启 动 的 时 候 被 创建 ， 并 且 它 在 实际 的 内 存 空间 中 和 
Java 扒 区 一 样 都 可 以 是 不 连续 的 。 方 法 区 是 一 块 比较 特殊 的 运行 时 内 存 
区 ， 有 一 些 Java 开 发 人 员 更 愿意 将 方法 区 称 之 为 “永久 区 (Permanent 
Generation) ”， 这 主要 是 因为 方法 区 除了 可 以 通过 选项 “-XX: 
MaxPermSize” 设 置 内 存 大 小 进行 动态 扩展 外 ， 并 不 会 像 Java 堆 区 那样 
频繁 地 被 GC 执行 回收 ， 甚 至 还 可 以 显 式 地 制定 是 否 需要 在 程序 运行 时 
回收 方法 区 中 的 数据 ， 这 就 是 方法 区 被 大 家 称 之 为 永久 代 的 原因 。 但 
是 并 不 表示 方法 区 中 的 数据 永远 不 会 被 回收 ， 如 果 在 没有 显 式 要 求 不 
对 方法 区 进行 内 存 回 收 的 情况 下 ，GC 的 回收 目标 仅 针 对 方法 区 中 的 常 
= MAH AX. 

方法 区 同样 也 有 可 能 发 生 内 存 洪 出 ， 一 旦 方法 区 中 的 内 存 大 小 超 
过 选项 “-XX : MaxPermSize” 所 指定 的 最 大 内 存 时 ， 将 会 抛 出 


OutOfMemoryError 异 常 。 

运行 时 常量 池 

运行 时 常量 池 属 于 方法 区 的 一 部 分 ， 一 个 有 效 的 字 节 码 文件 中 除 
了 包含 类 的 版 本 信息 、 字 段 、 方 法 以 及 接口 等 描述 信息 外 ， 还 包含 常 
量 池 表 (Constant Pool Table) ， 那 么 运行 时 常量 闻 就 是 字 节 码 文 件 中 
常量 闻 表 的 运行 时 表示 形式 。 运 行 时 常量 闻 中 包含 多 种 不 同 的 常量 ， 
比如 编译 器 就 已 经 明确 的 数值 字面 量 、 运 行 期 解析 后 才能 够 获得 的 方 
法 或 者 字段 3 引用。 运行 时 常量 闻 类 似 于 传统 编程 语言 中 的 符号 表 
(Symbol Table) ， 但 是 它 所 包含 的 数据 却 比 符 号 表 要 更 丰富 一 些 。 

当 装 载 器 成 功 将 一 个 类 或 者 接口 装载 进 JVM 后 ， 就 会 创建 与 之 对 
应 的 运行 时 常量 闻 ， 由 于 每 一 个 运行 时 常量 闻 所 分 配 的 内 存 来 源 于 方 
法 区 ,一 旦 所 需要 的 内 存 大 小 超过 方法 区 所 能 够 提供 的 最 大 值 时 ， 运 
行 时 常量 池 同 样 也 会 抛 出 OutOfMemoryError 异 常 。 

7.1.1.3 线程 私有 内 存 区 

和 线程 共享 内 存 区 不 同 的 是 ， 线 程 私有 内 存 区 是 不 允许 被 所 有 线 
程 共 享 访问 的 ， 也 就 是 说 ， 线 程 私 有 内 存 区 是 只 允许 被 所 属 的 独立 线 
程 进 行 访 问 的 一 类 内 存 区 ， 包 括 PC 寄 存 器 、Java 栈 及 本 地 方法 栈 等 3 个 
AFK, 

PC 寄存 器 

由 于 JVM 是 基于 栈 的 架构 ， 所 有 任何 的 操作 都 需要 经 过 入 栈 和 出 
栈 来 完成 。JVM 中 的 PC 寄存 器 (Program Counter Register) 并 非 是 广义 
上 所 指 的 物理 寄存 器 ， 或 者 将 其 翻译 为 PC 计数 器 较为 贴 切 。JVM 中 的 
PC 寄存 器 是 对 物理 PC 寄存 器 的 一 种 抽象 模拟 ， 它 是 线程 私有 的 ， 生 命 
周期 与 线程 的 生命 周期 保持 一 致 。 如 果 当 前 线程 所 执行 的 方法 是 一 个 
Java 方 法 ， 那 么 PC 寄存 器 就 会 存储 正在 执行 的 字 节 码 指 令 地 址 ， 反 之 
如 果 是 native 方 法 ， 这 是 PC 寄存 器 的 值 就 是 空 (undefined) 。 

PC 寄存 器 为 什么 会 被 设 定 为 线程 私有 ? 我 们 都 知道 所 谓 的 多 线程 
在 一 个 特定 的 时 间 段 内 只 会 执行 某 一 个 线程 的 方法 ，CPU 会 不 停 地 做 
任务 切换 ， 那 么 为 了 能 够 准备 地 记录 各 个 线程 正在 执行 的 当前 字 节 码 
指令 地 址 ， 最 好 的 办 法 自然 是 为 每 一 个 都 分 配 一 个 PC 寄存 器 ， 这 样 一 
来 各 个 线程 之 间 便 可 以 进行 独立 计算 ， 从 而 不 会 出 现 相 互 干扰 的 情 
况 。 尽 管 明确 了 PC 寄存 器 的 作用 和 目的 ， 但 是 存储 字 节 码 指令 地 址 有 


什么 作用 呢 ? JVM 的 字 节 解释 器 就 需要 通过 改变 PC 寄存器 的 值 来 明确 

下 一 条 应 该 执行 什么 样 的 字 节 码 指令 ， 当 然 Java 虚 拟 机 规范 并 没有 明确 

要 求 一 定 要 采用 这 种 方式 去 实现 。PC 寄 存 器 是 JVM 的 内 存 区 中 唯一 一 

个 没有 明确 规定 需要 抛 出 OutOfMemoryError 异 党 的 运行 时 内 存 区 。 
mJavaty 


在 Java 虚 拟 机 规范 中 ，Java 栈 也 可 以 被 称 为 Java 虚 拟 机 栈 (Java 
Virtual Machine Stack) ， 它 同 PC 寄 存 器 一 样 都 是 线程 私有 的 ， 并 且 生 
命 周期 与 线程 的 生命 周期 保持 一 致 。Java 栈 用 于 存储 栈 帧 (Stack 
Frame) ， 而 栈 帧 中 所 存储 的 就 是 局 部 变量 表 、 操 作 数 栈 ， 以 及 方法 出 
口 等 信息 。 

Java 堆 区 中 既然 存储 的 是 对 象 实例 ， 那 么 Java 栈 中 的 局 部 变量 表 就 
是 用 于 存储 各 类 原始 数据 类 型 、 对 象 引 用 (reference) 以 及 
returnAddress 类 型 。 人 参考 《Java 虚 拟 机 规范 Java SE7 版 》 的 描述 来 看 ， 
returnAddress 类 型 被 定义 为 Java 虚 拟 机 内 部 的 原始 数据 类 型 ， 该 类 型 用 
于 表示 一 条 字 节 码 指令 的 操作 码 (opcode) 。 但 是 returnAddress 类 型 在 
Java 语 言 中 却 不 存在 相对 应 的 类 型 ， 同 时 自然 也 无 法 在 运行 时 更 改 
returnAddress 类 型 的 值 。 尽 管 开 发 人 员 无 法 在 程序 中 直接 使 用 
returnAddress 类 型 ， 但 在 Java7 之 前 ， 该 类 型 却 被 用 于 finally 子 句 的 实 
现 。 

Java 栈 允许 被 实现 成 固定 大 小 的 内 存 或 者 是 可 动态 扩展 的 内 存 大 
小 ， 如 果 Java 栈 被 设 定 为 固定 大 小 的 内 存 ， 一 旦 线程 请 求 分 配 的 栈 容 量 
超过 JVM 所 允许 的 最 大 值 时 ，JVM 将 会 抛 出 一 个 StackOverflowError 异 
常 ， 反 之 抛 出 一 个 OutofMemoryError 异 常 。 

四 本 地 方法 栈 

本 地 方法 栈 (Native Method Stack) 用 于 支持 本 地 方法 (native 
法 ， 比 如 使 用 C/C++ 代码 编写 的 方法 ) 的 执行 ， 它 和 Java 栈 的 作用 类 
似 。Java 虚 拟 机 规范 并 没有 明确 要 求 本 地 方法 栈 的 具体 实现 方式 ， 甚 至 
如 果 JVM 产 品 并 不 打算 支持 native 方 法 ， 也 不 依赖 于 传统 栈 ， 则 可 以 无 
须 实 现 本 地 方法 栈 。 不 过 一 旦 JVM 中 实现 有 本 地 方法 栈 时 ， 那 么 它 将 
会 和 Java 栈 一 样 ， 允 许 被 实现 成 固定 或 者 是 可 动态 扩展 的 内 存 大 小 ， 并 
且 本 地 方法 栈 同样 也 会 抛 出 StackOverflowError 或 者 OutOfMemoryError 
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7.1.2 字 节 码 相关 知识 


7.1.2.1 字 节 码 组 织 结构 

Java 最 初 诞生 的 目的 就 是 为 了 在 不 依赖 于 特定 的 物理 硬件 和 操作 系 
统 环境 下 运行 ， 那 么 也 就 是 说 Java 程 序 实现 跨 平 台 特 性 的 基石 其 实 就 是 
字 节 码 (Byte Code) 。Java 之 所 以 能 够 解决 程序 的 安全 性 、 跨 平台 移 
植 性 等 问题 ， 最 主要 的 原因 就 是 Java 源 代码 的 编译 结果 并 非 是 本 地 机 器 
指令 ， 而 是 字 节 码 。 当 Java 产 代码 成 功 编译 成 字 节 码 后 ， 如 果 想 在 不 同 
的 平台 上 面 运 行 ， 则 无 须 再 次 编译 ， 也 就 是 说 Java 只 需 一 次 编译 就 可 处 
处 运行 ， 这 就 是 “Write Once, Run Anywhere” 的 思想 。 所 以 注定 了 Java 
程序 在 任何 物理 硬件 和 操作 系统 环境 下 都 能 够 顺利 运行 ， 只 要 对 应 的 
平台 装 有 特定 的 Java 运 行 环境 ，Java 程 序 就 可 以 在 上 面 运 行 ， 虽 然 各 个 
平台 的 Java 虚 拟 机 内 部 实现 细节 不 尽 相 同 ， 但 是 它们 共同 执行 的 字 节 码 
内 容 却 是 一 样 的。 那么 想 要 让 一 个 Java 程 序 正 确 地 运行 在 JVM 中 ，Java 
源码 就 必须 要 被 编译 为 符合 JVM 规 范 的 字 节 码 。 关 于 规范 ， 开 发 人 员 
在 使 用 Java 语 言 编写 一 个 Java 程 序 时 需要 遵循 Java 语 法 规范 ， 而 将 源码 
编译 为 字 节 码 的 时 候 又 需要 符合 JVM 规 范 。 和 简单 地 说 ， 前 端 编译 器 的 
主要 任务 就 是 负责 将 符合 Java 语 法 规范 的 Java 代 码 转换 为 符合 JVM 规 范 
的 字 节 码 文件 。 

字 节 码 结构 组 成 比较 特殊 ， 其 内 部 并 不 包含 任何 的 分 隔 符 区 分 段 
落 ， 所 以 无 论 是 字 节 顺序 、 数 量 都 是 有 很 严格 规定 的 ， 所 以 16 位 、32 
位 、64 位 长 度 的 数据 都 将 构造 成 2 个 、4 个 和 8 个 8 位 字 节 单位 来 表示 ， 
多 字 节 数据 项 总 是 按照 big-endian 顺 序 (高 位 字 节 载 地 址 最 低位 ， 低 位 
字 节 在 地 址 最 高 位 ) 来 进行 存储 的 ， 也 就 是 说 ， 一 组 8 位 字 节 单位 的 字 
节 流 组 成 了 一 个 完整 的 字 节 码 文 件 。 

每 一 个 字 节 码 文件 其 实 都 对 应 着 全 局 唯一 的 一 个 类 或 者 接口 的 定 
义 信 息 。 字 节 码 文件 采用 的 是 一 种 类 似 于 C 语 言 结构 体 的 伪 结 构 来 描述 
字 节 码 文件 格式 。 字 节 码 中 的 每 一 项 都 包括 类 型 、 名 称 以 及 该 项 的 数 
量 。 类 型 可 以 是 表 名 ， 同 时 也 是 基本 类 型 ， 包 含 在 字 节 码 文 件 中 ， 各 
项 按照 严格 的 顺序 进行 连续 存放 ， 其 内 部 并 不 包含 任何 的 分 隔行 区 分 
段落 。 在 这 个 结构 体 中 只 有 两 种 数据 结构 ， 分 别 是 无 符号 数 和 表 。 

表 是 由 多 个 无 符号 数 或 者 其 他 表 作 为 数据 项 构成 的 复合 数据 类 
型 ， 所 有 表 的 后 缀 都 是 使 用 ”info” 结 尾 ， 并 且 字 节 码 文件 实质 上 也 是 


一 张 表 。 尽 管 使 用 的 是 类 似 于 C 语 言 的 数组 语法 来 表示 表 中 的 项 ， 但 是 
无 法 直接 将 字 节 偏 移 量 作为 索引 对 表 进 行 访问 ， 因 为 表 中 的 每 一 项 的 
长 度 都 是 不 固定 且 可 变 的 。 而 当 描 述 一 个 数据 结构 为 数组 时 ， 就 意味 
着 它 由 0 至 多 个 长 度 固定 的 项 组 成 ， 这 个 时 候 便 可 以 采用 数组 索引 的 方 
式 对 其 进行 访问 。 每 一 个 字 节 码 文 件 对 应 着 一 个 ClassFile 的 结构 。 

7.1.2.2 javac 编 译 器 

字 节 码 就 相当 于 是 一 份 通用 的 掉 约 ， 尽 管 不 同 平台 上 的 Java 虚 拟 机 
的 实现 细节 不 尽 相 同 ， 但 是 它们 共同 执行 的 字 节 码 内 容 却 是 一 样 的 ， 
这 也 就 是 为 什么 Java 的 设计 者 们 将 Java 的 编译 结果 设 定 为 具有 平台 通用 
性 的 字 节 码 而 非 本 地 机 器 指令 的 目的 所 在 。 

Java 产 码 的 编译 结果 屏 数 了 与 底层 操作 系统 和 物理 硬件 相关 的 一 些 
特性 ， 使 得 开发 人 员 尽 可 能 地 只 需 关 注 于 自身 业务 。 因 为 只 有 这 样 ， 
体系 结构 中 立 、 与 平台 无 关 等 特性 才能 够 真正 地 构建 器 来 ， 否 则 Java 技 
术 就 是 一 门 传统 的 静态 编译 型 语言 ， 而 非 今天 的 动态 编译 型 语言 。 在 
JDK1.0 版 本 时 ，Java 程 序 的 运行 效率 确实 不 尽 如 人 意 ， 这 是 因为 Java 当 
时 的 解释 器 非常 低 效 ， 但 这 却 不 代表 Java 语 言 自身 低 效 ， 也 就 是 说 ， 程 
序 的 运行 性 能 与 编译 语言 其 实 是 没有 多 大 直接 关系 ， 真 正 决定 程序 运 
行 性 能 的 是 编译 器 。 不 过 在 当时 ， 由 于 技术 限制 等 原因 ，JVM 中 只 
解释 器 ， 而 没有 如 今 先进 高 效 的 JIT 编 译 器 。 

Java 源 代码 的 编译 结果 是 字 节 码 ， 那 么 肯定 需要 有 一 种 编译 器 能 够 
将 Java 源 码 编 译 为 字 节 码 ， 承 担 这 个 重 责 的 就 是 配置 在 “PATH”* 环 境 变 
量 中 的 javac 编 译 器 。javac 是 一 种 能 够 将 Java 源 码 编 译 为 字 节 码 的 前 端 
编译 器 。 

HotSpot VM 并 没有 强制 要 求 前 端 编译 器 只 能 使 用 javac 来 编译 字 节 
码 ， 其 实 只 要 编译 结果 符合 JVM 规 范 都 可 以 被 VM 所 识别 ， 所 以 在 Java 
的 前 端 编译 器 领域 ， 除 了 javac 之 外 ， 还 有 一 种 被 大 家 经 常用 到 的 前 端 
编译 器 ， 那 就 是 内 置 在 Eclipse 中 的 ECJ (Eclipse Compiler for Java) 编 
译 器 。 和 Javac 的 全 量 式 编 译 不 同 ，ECJ 是 一 种 增 量 式 编译 器 。 在 Eclipse 
中 ， 当 开发 人 员 编 写 完 代码 后 ， 使 用 “Ctrl+S” 快 捷 键 时 ，ECJ 编 译 器 所 
采取 的 编译 方案 是 把 未 编译 部 分 的 源码 逐 行 进行 编译 ， 而 非 每 次 都 全 
量 编译 。 因 此 ECyJ 的 编译 效率 会 比 javac 更 加 迅速 和 高 效 ， 当 然 编 译 质量 
和 javac 相 比 大 致 还 是 一 样 的 。 这 里 大 家 需要 注意 ， 前 端 编译 器 并 不 会 


直接 涉及 编译 优化 等 方面 的 技术 ， 而 是 将 这 些 具 体 优化 细节 移交 给 
HotSpot 的 JIT 编 译 器 负责 。 

ECJ 不 仅 是 Eclipse 的 默认 内 置 前 端 编译 器 ， 在 Tomcat 中 同样 也 是 使 
用 ECJ 编 译 器 来 编译 jsp 文 件 。 由 于 ECJ 编 译 器 是 采用 GPLv2 的 开源 协议 
进行 源 代 码 公 开 ， 所 以 ， 大 家 可 以 登录 eclipse 官 网 下 载 ECJ 编 译 器 的 源 
码 进行 二 次 开发 。 

7.1.2.3 编译 原理 

JVM 并 不 会 只 是 支持 java 语 言 ， 任 何 语言 编写 的 程序 都 可 以 运行 在 
JVM 中 ， 例 如 Scala 语 言 就 可 以 在 JVM 上 运行 ， 前 提 是 源码 的 编译 结果 
满足 并 包含 Java 虚 拟 机 的 内 部 指令 集 、 符 号 表 以 及 其 他 的 辅助 信息 ， 它 
只 要 是 一 个 有 效 的 字 节 码 文 件 ， 就 能 够 被 虚拟 机 所 识别 并 装载 运行 。 

Javac 编 译 器 在 将 Java 源 码 编译 为 一 个 有 效 的 字 节 码 文 件 过 程 中 经 
历 了 4 个 步骤 ， 分 别 是 词法 解析 、 语 法 解析 、 语 义 解析 以 及 生成 字 节 
t3, 

词法 解析 指 的 是 在 Java 语 言 中 ， 关 键 字 相 信 大 家 都 非常 熟悉 ， 所 谓 
关键 字 指 的 是 Java API 内 部 预定 义 的 一 些 字符 集合 (如 public、 
private, class=) 。 那 么 词法 解析 要 做 的 事情 就 是 将 Java 源 码 中 的 关键 
字 和 标示 符 等 内 容 转 换 为 符合 Java 语 法 规范 的 Token 序 列 ， 然 后 按照 指 
定 的 顺序 规则 进行 匹配 校 验 。 

语法 解析 指 的 是 将 词法 解析 后 的 Token 序 列 整合 为 一 棵 结构 化 的 抽 
象 语法 树 ， 因 为 我 们 知道 ， 一 个 try 语 句 后 面 肯 定 会 接 上 一 个 catch 或 者 
finally 字 句 ， 这 就 是 语法 解析 步骤 。 

语义 解析 指 的 是 由 于 语法 解析 器 所 解析 出 来 的 语法 数 并 不 能 直接 
应 用 于 生成 字 节 码 文 件 ， 这 是 因为 这 颗 语 法 数 相对 来 说 并 不 完善 ， 所 
以 语义 解析 的 目的 就 是 为 了 将 之 前 语法 解析 步骤 所 产生 的 语法 数 扩充 
得 更 加 完善 ， 后 续 编译 器 将 会 使 用 语义 解析 后 的 语法 数 来 生成 字 节 
码 。HotSpot 使 用 了 C++ 以 及 混合 了 少量 的 C 和 汇编 代码 编写 而 成 的 。 

词法 解析 式 javac 编 译 器 执行 字 节 码 编译 的 第 一 步 。 在 词法 解析 的 
过 程 中 ， 词 法 解析 器 最 主要 的 任务 就 是 将 Java 源 码 中 的 关键 字 和 标示 符 
等 内 容 转 换 为 符合 Java 语 法 规范 的 Token 序 列 ， 然 后 按照 指定 的 顺序 规 
则 进行 匹配 校 验 ， 以 便 为 后 续 的 语法 解析 步骤 做 准备 。 


ft javac 编译 器 中 ， 词 法 解析 器 接口 是 
com.sun.tools.javac.parser.Lexer ， 它 的 直接 派生 实现 是 位 于 同 包 下 的 
Scanner 类 ， 该 类 的 对 象 实例 由 ScannerFactory 工 厂 负 责 创 建 。Scanner 类 
的 主要 任务 就 是 按照 单个 字符 的 方式 读 取 Java 源 文件 中 的 关键 字 和 标示 
符 等 内 容 ， 然 后 将 其 转换 为 符合 Java 语 法 规范 的 Token 序 列 。 负 责 词法 
解析 工作 的 并 不 是 Scanner 类 ， 而 是 com.sun.tools.javac.parser.JavacParser 
类 ， 该 类 的 对 象 实 例 由 ParserFactory 工 厂 负 责 创建 。 也 就 是 说 ， 由 
JavacParser 类 负责 控制 词法 解析 时 的 具体 细节 ， 而 Scanner 类 仅仅 只 是 
负责 读 取 产 码 中 的 字符 集 和 以 及 与 Token 序 列 之 间 的 转换 任务 。 

7.1.2.4 符号 引用 

常量 池 中 主要 用 于 存放 字面 量 (Literal) 和 符号 引用 (Symbolic 
References) 两 大 类 数据 常量 ， 其 访问 方式 是 通过 索引 来 进行 访问 的 ， 
那么 符号 引用 则 由 3 种 特殊 的 字符 串 构成 ， 分 别 是 : 全 限定 名 、 简 单 名 
称 和 描述 符 。 

在 字 节 码 文 件 中 ， 使 用 全 限定 名 可 以 用 于 描述 类 或 者 接口 。 而 类 
或 接口 中 定义 的 字段 则 都 会 包含 一 个 简单 名 称 和 字段 描述 行 。 除 此 之 
外 ， 定 义 在 类 或 者 接口 中 的 方法 ,仍然 会 包含 一 个 简单 名 称 和 方法 描 
述 符 。 

字 节 码 文件 中 包含 的 所 有 类 或 者 接口 的 名 称 ， 都 是 通过 全 限定 名 
的 方式 来 进行 的 。CONSTANT_Class_info 表 中 的 name_index 是 一 个 指 
向 常量 池 列 表 中 一 个 类 型 为 CONSTANT_Utf8_info 常 量 项 的 索引 ， 通 过 
这 个 索引 值 即 可 成 功 获 取 CONSTANT _Utf8_info 常 量 项 中 的 全 限定 名 字 
符 串 ， 那 么 由 此 可 见 ， 类 或 者 接口 的 名 称 则 被 保存 在 一 个 类 型 为 
CONSTANT _Utf8_info 常 量 项 中 。 比 如 一 个 Object 类 型 的 全 限定 名 为 
java.lang.Object， 但 是 在 字 节 码 文 件 中 ， 全 限定 名 中 的 符号 “.” 被 符号 “/” 
进行 了 取代 ， 也 就 是 说 ，java/lang/Object 才 是 Object 类 型 在 字 节 码 文件 
中 的 内 部 表示 形式 。 那 么 像 Java API 中 的 一 些 其 他 类 型 ， 比 如 接口 Map 
在 字 节 码 文件 中 的 全 限定 名 则 是 java/utiyMap ，String 类 型 在 字 节 码 文件 
中 的 全 限定 名 则 是 java/lang/String。 

7.1.2.5 常量 池 

常量 闻 列 表 中 的 常量 数 并 不 固定 ， 因 此 在 常量 闻 之 前 就 需要 通过 
一 个 2 个 字 节 的 常量 闻 计 数 器 来 统计 常量 闻 列 表 中 到 底 拥有 和 多少 常 


项 。Java7 种 一 共 包 含 14 种 类 型 不 尽 相 同 的 常量 项 ， 但 是 每 个 常量 项 之 
间 的 格式 都 具有 一 定 的 通用 性 ， 比 如 每 一 个 常量 项 中 都 包含 1 个 字 节 的 
“tag” 项 作为 开头 ， 它 表明 了 常量 项 的 具体 类 型 和 格式 ， 而 后 面 info[] 项 
的 内 容 则 取决 于 tag 的 类 型 。 

在 常量 池 列 表 中 ，CONSTANT_Utf8_info 常 量 项 是 一 种 使 用 改进 过 
的 UTF-8 编 码 格式 来 存储 诸如 文字 字符 串 、 类 或 者 接口 的 全 限定 名 、 字 
段 或 者 方法 的 简单 名 称 以 及 描述 符 等 常量 字符 串 信 息 。 
CONSTANT _Utf8_info 常 量 项 的 表 结 构 信 息 如 代码 清单 7-1 所 示 。 


代码 清单 7-1 CONSTANT. Utf8 info 表 结构 信息 
CONSTANT Utf8 info 
{ 
url tag; 
u2 length; 
ul bytes[length]; 
} 


上 述 示例 代码 中 ，tag 项 表明 了 常量 项 的 具体 类 型 和 格式 ， 那 么 
CONSTANT Utf8 info 常 量 项 中 tag 项 的 值 则 为 CONSTANT_Utf8_info 
(1) 。length 项 指明 了 后 续 的 bytes[] 项 的 数组 长 度 (e AX) ， 而 
bytes[] 项 是 一 个 用 于 存储 常量 字符 串 信 息 的 byte 数 组 。 需 要 注意 的 是 ， 
改进 过 的 UTF-8 编 码 格式 与 传统 的 UTF-8 编 码 格式 存在 一 定 的 区 别 ， 改 
进 过 的 UTF-8 编 码 格式 从 Au0001-“、u007f: 之 间 的 字符 使 用 1 个 字 节 来 
RI, AM wu0080'-^u07ff' 之 间 的 字符 使 用 2 个 字 节 来 表示 ， 而 
从 "\u0800’-^\uffff’ 之 间 的 字符 则 与 传统 的 UTF-8 编 码 格式 一 样 使 用 3 个 字 
节 来 表示 。 
7.1.2.6 字段 表 
在 字 节 码 文件 中 ， 每 一 个 field_info 项 都 对 应 着 一 个 类 或 者 接口 中 
的 字段 信息 ， 用 于 表示 一 个 字段 的 完整 信息 ， 比 如 字段 的 标示 符 、 访 
问 修饰 符 (public、private 或 protected) 、 是 类 变量 还 是 实例 变量 
(static 修 饰 符 ) 、 是 否 是 常量 (final 修 饰 符 ) 等 。 在 此 大 家 需要 注 
意 ， 由 于 存储 在 field_info 项 中 的 字段 信息 并 不 包括 声明 在 方法 内 部 或 


者 代码 块 内 的 局 部 变量 ， 因 此 多 个 变量 之 间 的 作用 域 就 都 是 一 样 的 ， 
那么 Java 语 法 规范 必然 不 允许 在 一 个 类 或 者 接口 中 声明 多 个 具有 相同 标 
示 符 名 称 的 字段 。 但 是 和 Java 语 法 规范 相反 ， 字 节 码 文件 中 却 恰 恰 允 许 
存放 多 个 具有 相同 标示 符 名 称 的 字段 ， 唯 一 的 条 件 就 是 这 些 字 段 之 间 
的 描述 符 不 能 相同 。 

field_info 项 的 表 结 构 信 息 ， 如 代码 清单 7-2 所 示 。 


代码 清单 7-2 field info 项 的 表 结构 信息 
field info[ 
u2 access flags; 
u2 name index; 


u2 descriptor index; 


u2 attributes count; 
attribute info attributes[attributes count]; 


} 


上 述 代 码 示 例 中 ，access_flag 项 中 的 值 用 于 存储 在 类 或 接口 中 声明 
字段 时 所 用 到 的 访问 修饰 符 。 

7.1.2.7 方法 表 

在 字 节 码 文 件 中 ， 每 一 个 method_info 项 都 对 应 着 一 个 类 或 者 接口 
中 的 方法 信息 ， 或 者 由 编译 器 产生 的 方法 信息 (比如 : 类 (接口 ) 初 
始 化 方法 < clinit > () 和 实例 初始 化 方法 «init». O ) ， 用 于 表示 一 
个 方法 的 完整 信息 ， 比 如 方法 标示 符 、 方 法 的 访问 修饰 符 (public. 
private 或 protected) ， 方 法 的 返回 值 类 型 以 及 方法 的 参数 信息 等 。 需 要 
注意 的 是 ， 尽 管 Java 语 法 规范 并 不 允许 在 一 个 类 或 者 接口 中 声明 多 个 方 
法 签名 相同 的 方法 ， 但 是 和 Java 语 法 规范 相反 ， 字 节 码 文件 中 却 恰恰 允 
许 存 放 多 个 方法 签名 相同 的 方法 ， 唯 一 的 条 件 就 是 这 些 方 法 之 间 的 返 
回 值 不 能 相同 。method_info 项 的 表 结构 信息 如 代码 清单 7-3 所 示 。 


代码 清单 7-3 method info 项 的 表 结构 信息 
method no{ 
u2 access flags; 
u2 name index; 
u2 descriptor index; 
us attributes count; 
arrtibute info attributes[attributes count]; 


} 


name index 项 中 的 值 是 一 个 ie 向 常量 池 列 表 中 
CONSTANT _Utf8_info 常 量 项 的 有 效 索引 ， 通 通过 这 个 索引 值 即 可 成 功 获 
取 到 当前 方法 的 简单 名 称 。 而 descriptor_index 项 中 的 值 同样 也 是 一 个 指 
向 常量 池 列 表 中 CONSTANT _Utf8_info 常 量 项 的 有 效 索 引 ， 通 过 这 个 索 
引 值 即 可 成 功 获 取 到 当前 方法 的 描述 符 。attributes_count 项 指明 了 后 续 
attributes[] 项 的 数组 长 度 ，attributes[] 项 中 的 每 一 个 成 员 都 必须 是 一 
attributes_info 结 构 的 数据 项 。 

7.1.2.8 RER 


属性 在 字 节 码 文件 中 几乎 随处 可 见 ， 比 如 ClassFile、field_info 项 、 
method_info 项 和 Code_attribute 项 中 都 是 用 属性 。 属 性 表 的 通用 格式 如 
代码 清 单 7-4 所 示 。 


代码 清单 7-4 attribute info 项 的 表 结构 信息 
attribute info{ 
u2 attribute name index; 
u4 attribute length; 
ul info[attribute length]; 
} 


attribute name index 项 中 的 值 是 一 个 指向 常量 池 列 表 的 
CONTSANT_Utf8_info 常 量 项 的 有 效 索 引 ， 通 过 这 个 索引 值 即 可 成 功 获 
取 到 当前 属性 的 简单 名 称 。attribute_length 项 指明 了 后 续 Info[] 项 的 数组 
KE (不 过 并 不 包括 attribute_name_index 项 和 attribute_length 项 在 内 的 


起 始 6 个 字 节 长 度 ) ，info[] 项 中 的 成 员 并 没有 一 个 明确 的 要 求 一 定 要 符 
合 某 种 结构 的 数据 项 ， 也 就 是 说 ，info[] 项 中 的 成 员 结构 信息 完全 是 自 
定义 的 ， 该 项 用 于 存储 属性 的 数据 信息 。 


7.1.3 自动 内 存 管理 


程序 内 存 管 理 器 是 一 个 非常 敏感 的 话题 ， 对 于 C/C++ 开发 人 员 而 
言 ， 他 们 可 以 在 语法 层面 随意 控制 程序 中 一 个 对 象 的 生命 周期 ， 即 能 
够 自由 宣布 对 象 诞生 ， 又 能 够 随时 宣判 对 象 死 亡 ， 因 此 我 们 将 这 种 方 
式 称 为 手动 内 存 管 理 。 尽 管 手 动 内 存 管理 非常 自由 与 灵活 ， 但 是 其 浆 
端 同样 也 非常 明显 ， 由 于 手动 内 存 管 理 所 具备 的 复杂 性 ， 在 某 些 情况 
下 往往 会 直接 或 者 间接 导致 程序 在 运行 过 程 中 骨 溃 ， 并 且 一 旦 出 现 这 
种 情况 ， 开 发 人 员 便 会 将 大 把 的 时 间 滔 费 在 问题 定位 上 ， 所 以 手动 内 
存 管 理 是 一 把 利 与 浆 同 样 都 非 钊 明显 的 双 刃 剑 。 

手动 内 存 管理 究竟 会 发 生 哪些 意外 终止 程序 的 正常 运行 呢 ? 其 实 
综合 来 看 无 非 就 是 内 存 溢出 和 内 存 泄漏 这 两 个 最 主要 的 原因 。 内 存 泄 
凋 也 被 称 为 存储 闯 凋 ， 程 序 中 发 生 内 存 泄 漏 的 一 个 比较 常见 的 场景 误 
是 当 你 打算 释放 一 个 链表 所 引用 的 所 有 空间 时 ， 却 错误 地 只 释放 了 链 
表 的 第 一 个 元 素 ， 而 剩 下 的 元 素 尽管 已 经 不 再 被 引用 ， 但 是 它们 却 离 
开 了 整个 程序 的 控制 范围 ， 这 样 一 来 ， 链 表 中 的 元 素 所 占用 的 内 存 空 
间 将 永远 无 法 被 释放 ， 这 就 是 内 存 泄漏 。 尽 管内 存 泄漏 并 不 会 立刻 引 
起 程序 骨 溃 ， 但 是 一 旦 发 生 内 存 泄漏 ， 程 序 中 的 可 用 内 存 就 会 被 逐步 
笃 食 ， 直 至 耗 尽 所 有 内 存 ， 最 终 导 致 程序 朋 溃 。 而 内 存 溢出 相对 于 内 
存 泄 漏 来 说 ， 尽 管 更 容易 被 理解 ， 但 是 同样 的 ， 内 存 溢出 也 是 引发 程 
序 朋 溃 的 徘 鬼 祸首 之 一 。 或 许 手动 内 存 管理 所 具备 的 便捷 性 和 灵活 性 
在 某 些 情况 显得 非常 方便 ， 但 是 这 却 法 务 确保 每 一 个 开发 人 员 都 能 够 
在 创建 一 个 新 对 象 时 记得 在 使 用 完成 之 后 释放 掉 其 所 占用 的 内 存 空 
间 。 

自动 内 存 管 理 简 单 来 说 就 是 无 须 开 发 人 员 手 动 参与 内 存 的 分 配 与 
回收 ， 这 样 不 仅 能 够 降低 内 存 泄 漏 和 内 存 溢出 的 风险 ， 更 重要 的 是 自 
动 内 存 管理 机 制 能 够 使 得 开发 人 员 更 关注 于 自身 业务 。 但 是 对 于 Java 开 
发 人 员 而 言 ， 上 自动 内 存 管理 就 像 是 一 个 黑匣子 ， 如 果 过 度 依赖 于 * 目 
动 "， 那 么 这 将 会 是 一 场 灾 难 ， 最 严重 的 就 会 弱化 Java 开 发 人 员 在 程序 


出 现 内 存 洪 出 时 定位 问题 和 解决 问题 的 能 力 。 所 以 了 解 JVM 的 自动 内 
存 分 配 和 回收 原理 就 显得 非常 重要 ， 只 有 在 真正 了 解 JVM 是 如 何 管理 
内 存 后， 我 们 才能 够 在 遇见 OutOfMemorryError 时 ， 快 速 地 根据 错误 异 
单 日 志 定 位 问题 和 解决 问题 。 在 高 级 编程 语言 中 ， 自 动 内 存 管 理 机 制 
无 疑 已 经 是 未 来 的 发 展 趋势 ， 所 以 除了 Java 采 用 了 自动 内 存 管 理 机 制 
外 ， 还 有 像 Lisp、C#、Python、Ruby 等 编程 语言 同样 也 都 采用 了 自动 
内 存 管理 机 制 来 实现 内 存 的 动态 分 配 和 垃圾 回收 操作 。 

7.1.3.1 内 存 分 配 原 理 

尽管 Java 对 象 的 内 存 分 配 可 以 选择 在 堆 外 进行 ， 但 是 不 可 否认 这 仪 
仅 只 是 为 了 降低 GC 回 收 频率 以 及 提升 GC 回 收效 率 的 一 种 辅助 手段 ， 所 
以 Java 堆 区 仍然 是 分 配 / 存 储 对 象 实 例 的 主要 区 域 ， 这 一 点 必然 是 毋庸 
置疑 的 。 参 考 《Java 虚 拟 机 规范 Java SE7 版 》 的 描述 来 看 ，JVM 中 包含 
三 种 引用 类 型 ， 分 别 是 类 类 型 (classtype) 、 数 组 类 型 (array type) 
和 接口 类 型 (interface type) ， 这 些 引 用 类 型 的 值 则 分 别 由 类 实例 、 数 
组 实例 以 及 实现 了 某 个 接口 的 派生 类 实例 负责 动态 创建 ， 那 么 JVM 中 
究竟 是 如 何 为 这 些 类 型 创建 对 应 的 对 象 实例 呢 ? 以 创建 一 个 普通 的 Java 
对 象 为 例 ， 如 果 是 在 Java 语 法 层面 上 创建 一 个 对 象 无 非 就 是 使 用 new 天 
键 字 即 可 ， 但 是 在 JVM 中 就 没有 这 么 简单 了 。 简 单 来 说 ， 当 语法 层面 
使 用 new 关 键 字 创建 一 个 Java 对 象 时 ，JVM 首 先 会 检查 这 个 new 指 令 的 
参数 能 否 在 常量 池 中 定位 到 一 个 类 的 符号 引用 ， 然 后 检查 与 这 个 符号 
引用 相对 应 的 类 是 否 已 经 成 功 经 历 过 加 载 、 解 析 和 初始 化 等 步 又， 当 
类 完成 装载 步骤 之 后 ， 就 已 经 完全 可 以 确定 出 创建 对 象 实例 时 所 需要 
的 内 存 空间 大 小 ， 接 下 来 JVM 将 会 对 其 进行 内 存 分 配 ， 以 存储 所 生成 
的 对 象 实例 。 

为 新 对 象 分 配 内 存 是 一 件 非常 严谨 和 复杂 的 任务 ，JVM 的 设计 者 
们 不 仅 需 要 考虑 内 存 如 何 分 配 ， 在 哪里 分 配 等 问题 ， 并 且 由 于 内 存 分 
配 算法 与 内 存 回收 算法 密切 相关 ， 还 需要 考虑 GC 执 行 完 内 存 回 收 后 是 
否 会 在 内 存 空 间 中 产生 内 存 人 碎片 。 如 果 内 存 空 间 以 规整 和 有 序 的 方式 
分 布 ， 即 已 用 和 未 用 的 内 存 都 各 自 一 边 ， 彼 此 之 间 维 系 着 一 个 记录 下 
一 条 分 配 起 始点 的 标记 指针 ， 当 为 新 对 象 分 配 内 存 时 ， 只 需要 通过 修 
改 指 针 的 便宜 量 将 新 对 象 分 配 在 第 一 个 空 闪 内 存 位置 上 ， 这 种 分 配方 
式 就 叫 作 指针 碰撞 (Bump the Pointer) ， 反 之 则 只 能 使 用 空 内 列表 
(Free List) 执行 内 存 分 配 。 


基于 分 代 的 概念 ，Java 扒 区 如 果 还 要 更 进一步 细 分 的 话 ， 还 可 以 划 
分 为 新 生 代 (YoungGen) 和 老年 代 (OldGen) ， 其 中 新 生 代 内 又 可 以 
划分 为 Eden 空 间 、From Survivor 空 间 和 To Survivor 空 间 。 那 么 对 象 实例 
究竟 是 存储 在 堆 区 中 的 哪 一 个 区 域 下 呢 ? JVM 的 运行 时 数据 区 中 ， 堆 
区 和 方法 区 是 线程 共享 区 域 ， 任 何 线程 都 可 以 访问 到 这 两 个 区 域 中 的 
共享 数据 ， 由 于 对 象 实例 的 创建 在 JVM 中 非常 频繁 ， 因 此 在 并 发 环境 
下 从 堆 区 中 划分 内 存 空 间 是 非 线 程 安全 的 ， 所 以 务必 需要 保证 数据 操 
作 的 原子 性 。 

基于 线程 安全 的 考虑 ， 如 果 一 个 类 在 分 配 内 存 之 前 已 经 成 功 完成 
类 装载 步骤 之 后 ，JVM 就 会 优先 选择 在 TLAB (Thread Local 
Allocation， 本 地 线程 分 配 缓冲 区 ) 中 为 对 象 实 例 分 配 内 存 空间 ，TLAB 
在 Java 推 区 中 是 一 块 线程 私有 区 域 ， 它 包含 在 Eden 空 间 内 ， 除 了 可 以 避 
免 一 系列 的 非 线程 安全 问题 外 ， 同 时 还 能 够 提升 内 存 分 配 的 吞吐 量 ， 
因此 我 们 可 以 将 这 种 内 存 分 配方 式 称 为 快速 分 配 策 略 。 

尽管 不 是 所 有 的 对 象 实例 都 能 够 在 TLAB 中 成 功 分 配 内 存 ， 但 JVM 
确实 是 将 TLAB 作 为 内 存 分 配 的 首选 ， 在 程序 中 开发 人 员 可 以 通过 选项 
“XX! UseTLAB” 设 置 是 否 开 启 TLAB 空 间 。TLAB 空 间 的 内 存 非 常 
小 ， 默 认 情 况 下 仅 占 有 整个 Eden 空 间 的 1%， 当 然 我 们 可 以 通过 选项 “- 
XX: TLABWasteTargetPereent” 设 置 TLAB 空 间 所 占用 Eden 空 间 的 百 分 
比 大 小 。 一 旦 对 象 在 TLAB 空 间 分 配 内 存 失 败 ，JVM 就 会 尝试 着 通过 使 
用 加 锁 机 制 确保 数据 操作 的 原子 性 ， 从 而 直接 在 Eden 空 间 中 分 配 内 
存 ， 如 果 在 Eden 空 间 中 也 无 法 分 配 内 存 时 ，JVM 就 会 执行 MinorGC ， 
直至 最 终 可 以 在 Eden 空 间 中 分 配 内 存 为 止 (如 果 是 大 对 象 则 直接 在 老 
年 代 中 分 配 ) 。bytecodeInterpreter.cpp 

7.1.3.2 逃逸 分 析 与 栈 上 分 配 

Java 扒 区 已 经 不 再 是 对 象 内 存 分 配 的 唯一 选择 ， 如 果 和 希望 降低 GC 
的 回收 频率 和 提升 GC 的 回收 频率 ， 那 么 则 可 以 使 用 堆 外 存储 技术 。 目 
前 最 党 见 的 堆 外 存储 技术 就 是 利用 逃逸 分 析 技 术 得 选 出 未 发 生 逃 逸 的 
对 象 ， 然 后 避 开 堆 区 而 直接 选择 在 栈 帧 中 分 配 内 存 空 间 。 

逃逸 分 析 (Escape Analysis) 是 JVM 在 执行 性 能 优化 之 前 的 一 种 分 
析 技 术 ， 它 的 具体 目标 就 是 分 析出 对 象 的 作用 域 。 简 单 来 说 ， 当 一 个 
对 象 被 定义 在 方法 体内 部 之 后 ， 它 的 受 访 权 限 仅 限 于 方法 体内 ,一 旦 


其 引用 被 外 部 成 员 引 用 后 ， 这 个 对 象 就 因此 发 生 了 逃逸 ， 反 之 如 果 定 
义 在 方法 体内 的 对 象 并 没有 被 任何 的 外 部 成 员 引 用 ，JVM 就 会 为 其 在 
栈 帧 中 分 配 内 存 空间 。 


代码 清单 7-5 逃逸 分 析 示 例 代 码 
public class StackAllocation { 
public StackAllocation obj; 


public StackAllocation getStackAllocation () { 
// 方 法 返回 StackAllocation TRE, RAM 
return null == obj? new StackAllocation() : obj; 
} 
public void setStackAllocation () { 
| /为 成 员 变量 进行 典 值 ， 发 生 远 逸 
ob} = new StackAllocation(); 
} 
public void useStackAllocationl () { 
ARARA ZEME, ERR 
StackAllocation obj = getStackAllocation(); 
} 
public void useStackAllocation2 () { 
// 对 象 的 引用 域 仅 限于 方法 体内 ， 为 发 生 逃 饮 
StackAllocation obj = new StackAllocation(); 


} 


由 于 对 象 直接 在 栈 上 分 配 内 存 ， 因 此 GC 就 无 须 执行 垃圾 回收 。 栈 
帧 会 伴随 着 方法 的 调用 而 创建 ， 伴 随 着 方法 的 执行 结束 而 销毁 ， 由 此 
可 见 ， 栈 上 分 配 的 对 象 所 占用 的 内 存 空间 将 会 随 着 栈 帧 的 出 栈 而 释 
放 。 在 JDK 6u23 版 本 之 后 ，HotSpot 中 默认 就 已 经 开启 了 逃逸 分 析 ， 如 
果 使 用 的 是 较 早 的 版 本 ， 开 发 人 员 则 可 以 通过 选项 <-XX : 


+DoEscapeAnalysis” 显 式 开 局 逃逸 分 析 ， 以 及 通过 选项 “<-XX : 
*PrintEscapeAnalysis" EA 363 23 AT B Ubi? 2i Ro 

7.1.3.3 对 象 内 存 布局 与 OOP-Klass 模 型 

当成 功 对 分 配 后 的 内 存 空 间 执行 零 值 初始 化 后 ，JVM 接 下 来 就 会 
对 对 象 进行 实例 化 。 在 HotSpot 中 ， 对 象 实例 化 操作 无 非 就 是 初始 化 对 
象 头 和 实例 数据 ， 而 且 存 储 对 象 实例 信息 的 内 存 布局 也 主要 由 这 两 个 
部 分 构成 。 先 从 对 象 头 开始 谈 起 ， 对 象 头 中 主要 用 于 存储 Mark Word 和 
元 数据 指针 等 数据 ， 其 中 Mark Word 主 要 用 于 存储 对 象 运行 时 的 数据 信 
息 ， 比 如 HashCode、GC 分 代 年 龄 、 锁 状态 标志 、 线 程 持 有 的 锁 、 偏 向 
线程 ID、 仿 向 时 间 惟 等。 而 元 数据 指针 则 是 用 于 指向 方法 区 中 目标 类 
的 类 型 信息 ， 也 就 是 说 通过 元 数据 指针 可 以 准确 定位 到 当前 对 象 的 具 
体 目标 类 型 。 

除了 对 象 头 之 外 ， 内 存 布局 的 另 一 部 分 是 实例 数据 。 实 例 数 据 主 
要 用 于 存储 定义 在 当前 对 象 中 各 种 类 型 的 字段 信息 (包括 派生 于 超 类 
的 字段 信息 ) ， 存 储 在 实例 对 象 中 的 字段 顺序 除了 会 与 字段 在 Java 类 中 
定义 的 顺序 有 关外 ， 还 会 受到 JVM 分 配 和 策略 参数 

(FieldsAllocationStyle) 的 影响 ， 当 然 开 发 人 员 可 以 通过 选项 “-XX: 
FieldsAllocationStyle” 设 置 JVM 的 分 配 策略 参数 。HotSpot 默 认 会 按照 
longs/doubles、ints、shorts/chars、Pbytes/booleans、oops 的 分 配 策略 顺序 
进行 分 配 ， 按 照 HotSpot 默 认 的 分 配 策略 后 发 现 ， 二 进 制 位 数 相 同 的 字 
段 总 是 被 划分 到 一 起 。 在 满足 这 个 前 提 的 情况 下 ， 在 超 类 中 定义 的 变 
量 很 有 可 能 会 出 现在 派生 类 之 前 。 

当 大 家 理解 Java 对 象 在 内 存 中 是 如 何 存储 的 ， 接 下 来 我 们 再 来 看 
JVM 中 究竟 是 如 何 表 达 Java 类 以 及 对 象 实 例 的 ， 毕 竟 Java 语 言 只 是 一 个 
中 间 语 言 ， 运 行 在 JVM 中 还 是 需要 一 套 完 整 的 底层 内 部 对 象 表示 机 
制 。 OOP-Klass 模 型 就 是 用 于 表示 Java 类 以 及 对 象 实例 的 一 种 数据 结 
构 ， 其 中 OOP (Ordinary Object Pointer， 普 通 对 象 指针 ) 用 于 描述 对 象 
的 实例 信息 ， 而 Klass 则 用 于 摘 述 对 象 实例 的 目标 类 型 ， 也 就 是 说 Klass 
其 实 是 一 个 与 Java 类 相对 应 的 JVM 中 的 内 部 对 等 体 ， 我 们 也 可 以 将 其 称 
为 C++ 对 等 体 。 

OOP 与 Klass 其 实 是 两 个 相互 独立 但 是 却 又 彼此 相互 关联 的 模块 ， 
这 两 个 模块 均 包 含 在 /openjdk/hotspots/src/share/vm/oops 模 块 中 ， 那 么 


OOP-Klass 模 型 与 对 象 的 内 存 布局 之 间 又 有 什么 关系 呢 ? 在 JVM 中 对 象 
头 就 是 由 OOP 对 和 象 instanceOopDesc 来 表示 的 (数组 类 型 /大 用 
arrayOopDesc 对 象 来 表示 ) ， 而 对 象 头 中 的 元 数据 指针 所 指向 的 当前 对 
象 的 目标 类 型 则 是 由 表示 一 个 Java 类 的 对 等 体 。 当 明确 OOP-Klass 模 型 
的 作用 后 ，JVM 可 以 通过 对 象 引 用 准确 定位 到 Java 堆 区 中 的 
instanceOopDesc 对 象 ， 这 样 既 可 成 功 访问 到 对 象 的 实例 信息 ， 当 需要 
访问 目标 对 象 的 具体 类 型 时 ，JVM 则 会 通过 存储 在 instanceOopDesc 中 
的 元 数据 指针 定位 到 存储 在 方法 区 中 的 instanceKlass 对 象 上 。 
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1995 年 以 来 ，Java 发 生 了 翻天 和 覆 地 的 变化 ， 出 现 过 许多 种 Java 虚 拟 
机 ， 现 在 越 来 越 多 的 Java 应 用 的 性 能 都 能 达到 要 求 ， 这 要 归功 于 内 建 的 
JIT 编 译 器 、 垃 圾 收集 器 ， 以 及 不 断 改进 的 运行 时 环境 (JVM Runtime 
Environment) 。 虽 然 JVM 有 了 许多 改进 ， 应 用 的 性 能 和 扩展 性 仍然 受 
到 很 多 人 的 关注 。 许 多 应 用 的 开发 需求 都 增加 了 性 能 要 求 ， 服 务 等 级 
协议 (Service Level Agreement) 中 也 添加 性 能 条 款 。 随 着 现代 JVM 性 
能 和 扩展 性 的 改善 ，Java 技 术 的 应 用 愈加 广泛 。 

若 要 提高 Java 性 能 调 优 的 能 力 ， 就 必须 对 现代 JVM 有 些 认识 ， 本 书 
以 HotSpot VM 为 例 。HotSpot VM 有 3 个 主要 组 件 ， 即 VM 运行 时 
(Runtime) 、JIT 编 译 器 (IT Compiler) 以 及 内 存 管理 器 (Memory 
Manager) 。 


7.2.1 JVM 的 基本 架构 


早期 的 HotSpot VM 是 32 位 JVM， 内 存 地 址 空间 限制 为 4GB， 此 外 
实现 Java 堆 的 大 小 还 进一步 受 限于 操作 系统 。Windows 上 HotSpot VM 最 
大 可 用 的 Java 堆 大 约 为 1.5GB，Linux 操 作 系 统 上 最 大 可 用 堆 大 约 为 
2.5GB 到 3.0GB。 实 际 消 耗 的 最 大 内 存 地 址 空间 随 给 定 的 Java 应 用 和 
JVM 有 版 本 有 所 不 同 。 

随 着 服务 器 系统 内 存 的 不 断 增 大 ，64 位 HotSpot VMM AME., È 
增 大 了 Java 扒 ， 使 得 这 些 系统 可 以 使 用 更 多 内 存 。 虽 然 64 位 寻 址 对 一 些 
应 用 有 帮助 ， 但 64 位 VM 也 带 来 了 性 能 损失 ，HotSpot 内 部 Java 对 象 表示 


( 称 为 普通 对 象 指 针 ，Ordinary Object Pointers ， 或 oops) 的 长 度 从 32 
位 变 成 了 64 位 ， 导 致 CPU 高 速 缓存 行 (CPU Cache Line) 中 可 用 的 oops 
变 少 ， 从 而 降低 了 CPU 缓 存 的 效率 。 缓 存 效率 的 降低 常常 导致 性 能 比 
32 位 JVM 下 降 8% 玉 15%。 和 OpenJDK 一 样 ，Java6 HotSpot YM 添加 了 
称 为 压缩 指针 (Compressed oops, -XX: +UseCompressedOops 开 启 ) 
的 新 特性 ， 使 得 64 位 Java 的 大 尺寸 堆 和 32 位 JVM 的 性 能 都 得 到 了 很 大 提 
升 。 压 缩 指针 之 所 以 可 以 改善 性 能 ， 是 因为 它 通 过 对 齐 

(Alignment) 、 偏 移 量 (Offset) 将 64 位 指针 压缩 成 32 位 。 换 言 之 ， 性 
能 提高 是 因为 使 用 了 更 小 更 节省 空间 的 压缩 指针 而 不 是 完整 长 度 的 64 
位 指针 ，CPU 缓 存 使 用 率 由 此 得 以 改善 ， 应 用 程序 也 能 执行 得 更 快 。 

此 外 ， 在 一 些 平台 上 ， 例 如 Intel 或 AMDx64，64 位 JVM 可 以 使 用 更 
多 的 CPU 寄存 器 ， 这 有 助 于 程序 性 能 的 改善 。 更 多 的 CPU 寄存 器 可 以 
避免 宥 存 器 溢出 (Register Spilling) [3]。 当 活跃 状态 (Live State, BM 
变量 ) 数 超过 CPU 寄存 器 ， 多 出 的 活跃 状态 只 能 存放 在 内 存 中 时 ， 就 
会 发 生 寄存 器 邮 载 。 寄 存 器 芭 载 时 ， 某 些 活跃 状态 必须 从 CPU 寄存 器 
印 载 到 内 存 中 。 因 此 ， 避 免 寄存 器 写 在 可 以 让 程序 执行 得 更 快 。 

HotSpot 的 Launcher 组 件 负责 维护 JVM 的 整个 生命 周期 ， 在 Launcher 
启动 HotSpot 时 ， 大 部 分 的 功能 是 通过 函数 指针 指向 本 地 孙 数 ， 再 由 本 
地 函数 调用 指定 模块 的 具体 图 数 去 实现 的 ， 那 么 当 Launcher 中 的 局 动 函 
3X main () 创建 主线 程 并 调用 JavaMain () KAM, ZH 
InvocationFunctions Z5 2! AY && Zi $8 $T CreateJavaJVM T8 [5] AS 3t ER BK 
JNI CreateJavaJjVM () 完成 JVM 的 初始 化 工作 ， 而 在 
JNI CreateJavaJVM () 国 数 内 部 却 调用 了 Threads 模 块 的 create_vm Q 
函数 来 最 终 完 成 JVM 的 初始 化 。 

HotSpot 的 顶层 模块 包括 : 

u adlc 模 块 中 所 包含 的 功能 为 平台 描述 文件 的 编译 器 。 

m asm 模 块 中 所 包含 的 功能 为 汇编 器 接口 。 

m cl 模块 中 所 包含 的 功能 为 cient 编译 器 。 

mw ci 模块 中 所 包含 的 功能 为 动态 编译 器 的 公共 服务 /从 动态 编译 器 到 
VM 的 接口 。 

m classFile 模 块 中 所 包含 的 功能 为 类 文件 的 处 理 ， 包 括 类 加 载 和 系 
统 符号 表 等 。 


m code 模 块 中 所 包含 的 功能 为 动态 生成 的 代码 的 管理 。 

m compiler 模 块 中 所 包含 的 功能 为 从 VM 调用 动态 编译 器 的 接口 。 

gc 模块 由 gc interface 和 gc implementation 两 部 分 构成 ， 其 中 
gc_interface 模 块 中 所 包含 的 功能 为 GC 的 接口 ， 而 gc_implementation 模 
块 中 所 包含 的 功能 为 GC 的 实现 ， 该 模块 中 还 包含 了 
concurrentMarkSweep、G1、ParallelScavenge、parNew 和 Shared 这 5 个 重 
要 的 子 模块 ， 其 中 concurrentMarkSweep 子 模块 中 所 包含 的 功能 为 


Concurrent Mark Sweep GC 的 实现 ，G1 子 模块 所 包含 的 功能 为 Garbage- 
First GC 的 实现 ，parallelScavenge 子 模块 中 所 包含 的 功能 为 
ParallelScavenge GC 的 实现 ，parNew 子 模块 中 所 包含 的 功能 为 
ParNewGC 的 实现 ，shared 子 模块 中 所 包含 的 功能 为 GC 的 共通 实现 。 

interpreter 模 块 中 所 包含 的 功能 为 内 部 解释 器 ， 包 括 模 板 解 释 器 和 
C++ 解释 器 。 

libadt 模 块 中 所 包含 的 功能 为 一 些 抽象 数据 结构 。 

memory 模 块 中 所 包含 的 功能 为 内 存 管理 相关 代码 。 

oops 模 块 中 所 包含 的 功能 为 server 编 译 器 。 

Prims 模 块 中 包含 的 功能 为 HotSpot YM 的 对 外 接口 ， 包 括 部 分 标准 
库 的 native 部 分 和 JVMTI 实 现 。 

runtime 模 块 中 所 包含 的 功能 为 运行 时 支持 库 ， 包 括 线程 管理 、 编 
译 器 调度 、 锁 、 反 射 等 。 

services 模 块 中 所 包含 的 功能 主要 是 用 来 支持 JMX 之 类 的 管理 功能 
的 接口 。 

shark 模 块 中 所 包含 的 功能 为 基于 LLVM 的 JIT 编 译 器 。 

utilities 模 块 中 所 包含 的 功能 为 一 些 基 本 的 工具 类 。 


7.22 JVM 初 始 化 过 程 
HotSpot VM 运行 时 环境 担当 着 许多 职责 ， 包 括 命令 行 选项 解析 、 


VM 生命 周期 管理 、 类 加 载 、 字 节 码 解释 、 异 常 处 理 、 同 步 、 线 程 管 
理 、Java 本 地 接口 、VM 致 命 错 误 处 理 和 C++ (dEJava) 堆 管 理 。 


HotSpot VM 运行 时 系统 负责 启动 和 停止 HotSpot VM。 局 动 HotSpot 
VM 的 组 件 是 启动 器 。HotSpot VM 有 若干 个 启动 器 。Unix/Linux 上 最 常 
用 的 是 java，Windows 上 是 java 和 javaw ， 也 可 以 通过 JNI 接 口 
JNI_CreateJavaVM 启 动 内 赂 的 JVM。 另 外 还 有 一 个 网 络 启动 器 javaws， 
Web 浏 览 器 用 它 来 启动 applet。javaws 末 尾 的 ws 通常 指 的 是 web start, M 
术语 Java Web Start 即 指 javaws。 

启动 器 启动 HotSpot VM 时 会 执行 一 系列 操作 。 步 又 概 述 如 下 : 

(1) 解析 命令 行 选项 。 启 动 器 会 直接 处 理 一 些 命令 行 选项 ， 例 如 - 
client 或 -server， 它 们 决定 加 载 哪 个 JIT 编 译 器 ， 其 他 参数 则 传 给 HotSpot 
VM; 

(2) 设置 堆 的 大 小 和 JIT 编 译 器 。 如 果 命 令 行 没有 明确 设置 堆 的 大 
小 和 JIT 编 译 器 (client 或 server) ， 启 动 器 则 通过 自动 化 有 进行 设置 。 
自动 优化 的 默认 设 定 因 底层 系统 配置 和 操作 系统 而 有 所 不 同 ; 

(3) 设 定 环境 变量 ， 例 如 LD_LIBRARY_PATH 和 CLASSPATH; 

(4) 如 果 命 令 行 有 -jar 选 项 ， 启 动 器 则 从 指定 JAR 的 manifest 中 查 
找 Main-Class， 否 则 从 命令 行 读 取 Main-Class ; 

(5) 使 用 标准 Java 本 地 接口 (Java Native Interface, JNI) 方法 
JNI CreateJavaVM 在 新 创建 的 线程 中 创建 HotSpot VM。 与 后 创建 的 线 
程 相 比 ， 初 始 线程 是 启动 新 进程 时 操作 系统 内 核 分 配 的 第 一 个 线程 ， 
而 新 建 HotSpot VM 进 程 中 运行 的 初始 线程 也 是 同样 道理 。 不 在 初始 线 
程 中 创建 HotSpot VM， 是 为 了 可 以 对 它 进 行 定 制 ， 例 如 Windows 上 更 
改 栈 的 大 小 ; 

(6) 一 旦 创建 并 初始 化 好 HotSpot VM ， 就 会 加 载 Java Main- 
Class， 启 动 器 也 会 从 Java Main-Class 中 得 到 Java main 方 法 的 参数 ; 

(7) HotSpot VM 通过 JNI 方 法 CallStaticVoidMethod 调 用 Java main 
方法 ， 并 将 命令 行 选项 传 给 它 。 

至 此 ，HotSpot VM 开始 正式 执行 命令 行 指定 的 Java 程 序 了 。 由 
Launcher 负 责 调用 HotSpot 的 核心 代码 对 JVM 执 行 初始 化 ， 以 及 由 它 负 
责 维护 JVM 的 整个 生命 周期 。 

Launcher 是 一 种 用 于 启动 JVM 进 程 的 启动 器 ， 并 且 可 以 根据 类 别 划 
分 为 两 种 不 同 的 Launcher ， 一 种 是 正式 版 的 启动 器 ， 也 就 是 大 家 在 


Windows 平 台 下 经 常用 到 的 java.exe 和 javaw.exe 程 序 。 前 者 在 运行 时 会 
保留 控制 台 ， 以 及 显示 程序 的 输出 信息 。 而 后 者 主要 是 用 于 执行 Java 的 
GUI 程序 ， 也 就 是 说 ， 使 用 javaw.exe 执 行 Java 程 序 时 不 会 显示 任何 的 程 
序 的 输出 信息 。 

从 严格 意义 上 来 说 ，Launcher 只 是 一 个 封装 了 虚拟 机 的 执行 外 壳 ， 
由 它 负 责 状 态 JRE 环 境 和 Windows 平 台 下 的 jvm.dll 动 态 封装 库 ， 也 就 是 
说 ， 当 执行 多 个 Java 程 序 时 ， 也 就 意味 着 同时 启动 了 多 个 JVM 进 程 。 

JVM 的 初始 化 操作 其 实 就 是 HotSpot 执 行 启动 的 前 提 条 件 ， 并 且 在 
初始 化 过 程 中 还 涉及 HotSpot 中 一 些 核 心 模块 的 初始 ， 例 如 初始 化 OS 模 
块 、 初 始 化 全 局 数据 结构 、 启 动 线程 、 初 始 化 全 局 模块 等 。 

一 旦 Java 程 序 或 者 Java main 方 法 执行 结束 ，HotSpot VM 就 必须 检 
查 和 清理 所 有 程序 或 者 方法 执行 过 程 中 生成 的 未 处 理 异常 。 此 外 ,， A 
法 的 退出 状态 和 线程 的 退出 状态 也 必须 返回 它们 的 调用 者 。 调 用 Java 本 
地 接口 方法 DetachCurrentThread 将 Java main 方 法 与 HotSpot YM 脱离 

(Deteched) 。 每 次 HotSpot VM 调用 DetachCurrentThread 时 ， 线 程 数 就 

会 碱 1， 因 此 Java 本 地 接口 知道 何 时 可 以 安全 地 关闭 HotSpot VM， 并 能 
确保 当时 HotSpot VM 中 没有 正在 执行 的 操作 ，Java 栈 中 也 没有 激活 的 
Java 帧 。 

HotSpot VM 启动 时 JNI_CreateJavaVM 方 法 将 执行 以 下 一 系列 操 
作 。 

(1) 确保 只 有 一 个 线程 调用 这 个 方法 并 且 确 保 只 创建 一 个 HotSpot 
VM 实例 。 因 为 HotSpot VM 创建 的 静态 数据 结构 无 法 再 次 初始 化 ， 所 以 
一 旦 初始 化 达到 某 个 确定 点 后 ， 进 程 空间 里 就 只 能 有 一 个 HotSpot 
VM。HotSpot VM 的 启动 至 此 已 经 无 法 扭转 ; 

(2) 检查 并 确保 支持 当前 的 JNI 版 本 ， 初 始 化 垃圾 收集 日 志 的 输 
出 流 ，; 

(3) 初始 化 OS 模块 ， 如 随机 数 生 成 器 (Random Number 
Generator) 、 当 前 进程 id (Current Process id) 、 高 精度 计时 器 (High- 
Resolution Timer) ~ A AR (Memory Page Sizes) 、 保 护 页 

(Guard Pages) 。 保 护 页 是 不 可 访问 的 内 存 页 ， 用 作 内 存 访 问 区 域 的 
边界 。 例 如 ， 操 作 系 统 常 在 线程 栈 顶 压 入 一 个 保护 页 以 保证 引用 不 会 
超出 栈 的 边界 5 


(4) 解析 传 入 JNI_CreateJavaVM 的 命令 行 选项 ， 保 存 以 备 将 来 使 
H; 

(5) 初始 化 标准 的 Java 系 统 属性 ， 例 如 java.version、java.vendor、 
os.name 等 ; 

(6) 初始 化 支持 同步 、 栈 、 内 存 和 安全 点 页 的 模块 ; 

(7) 加 载 libzip、libnpi、libjava 及 libthread 等 库 ; 

(8) 初始 化 并 设置 信号 处 理 器 (Signal Handler) ; 

(9) 初始 化 线程 库 ; 

(10) 初始 化 输出 流 日 志 记 录 器 (Logger) ; 

(11) 如 果 用 到 Agent 库 (hprof, jdi) ， 则 初始 化 并 启动 ; 

(12) 初始 化 线程 状态 (Thread State) 和 线程 本 地 存储 (Thread 
Local Storage) ， 它 们 存储 了 线程 私有 数据 ; 

(13) 初始 化 部 分 HotSpot VM 全 局 数据 ， 例 如 事件 日 志 (Event 
Log) ，OS 同 步 原 语 、perftMemory (性 和 统计 数据 内 存 ) ， 以 及 
chunkPool (内 存 分 配 期 ) ; 

(14) 至 此 ，HotSpot VM 可 以 创建 线程 了 。 创 建 出 来 的 Java 版 
main 线 程 被 关联 到 当前 操作 系统 的 线程 ， 只 不 过 还 没有 添加 到 已 知 线 
程 列表 中 ; 

(15) 初始 化 并 激活 Java 级 别 的 同步 ; 

(16) 初始 化 启动 类 加 载 器 (Bootclassloader) 、 代 码 缓存 、 解 释 
器 、JIT 编 译 器 、JNI、 系 统 词典 (System Dictionary) 及 universe (一 种 
必 备 的 全 局 数据 结构 集 ) 。universe 是 HotSpot VM 的 一 个 重要 的 全 局 数 
据 结构 ， 里 面包 含 了 一 系列 与 Java 对 象 存 储 相 关 的 重要 全 局 数据 结构 。 
universe 这 种 叫 法 源 自 SmallTalk， 所 谓 “niverse of objects”, ALM 
是 用 来 存储 所 有 对 象 的 东西 的 概念 。 在 HotSpot VM 里 ，universe 类 是 一 

ds 类 ， 里 面 是 GCheap、SystemDictionary 等 与 Java 对 象 存 储 相 关 的 
结构 的 引用 ; 

(17) 现在 ， 添 加 Java 主 线程 到 已 知 线程 列表 中 。 检 查 universe 是 
否 正常 。 创 建 HotSpot VM Thread, Cit HotSpot VM 所 有 的 关键 功 
能 。 同 时 发 出 适当 的 JVMTI 事 件 ， 报 告 HotSpot VM 的 当前 状态 ，; 


(18) 加 载 和 初始 化 以 下 Java 类 : java.lang.String ~ 
java.lang.System 、 javalang.Thread 、 java.lang.ThreadGroup 、 
java.lang.reflect.Method、java.lang.ref.Finalizer、java.lang.Class 以 及 余下 
的 Java 系 统 类 。 此 时 ，HotSpot 已 经 初始 化 完毕 并 可 使 用 ， 只 是 功能 还 
不 完备 ; 

(19) 启动 HotSpot VM 的 信号 处 理 器 线程 ， 初 始 化 JIT 编 译 器 并 启 
动 HotSpot 编 译 代理 线程 。 启 动 HotSpot VM 辅助 线程 〈 如 监控 线程 盒 统 
计 抽 样 器 ) 。 至 此 ，HotSpot VM 已 功能 完备 ; 

(20) 最后， 生成 JNIEnv 对 象 返 回 给 调用 者 ，HotSpot 则 准备 相应 
新 的 JNI 请 求 。 

如 果 HotSpot VM 启动 过 程 中 发 生 错 误 ， 启 动 器 会 调用 
DestoryJavaVM 方 法 关闭 HotSpot VM。 如 果 HotSpot VM 启动 后 的 执行 
过 程 中 发 生 很 严重 的 错误 ， 也 会 调用 DestoryJavaVM 方 法 。 

DestoryJavaVM 按 以 下 步骤 停止 HotSpot VM。 

(1) 一 直 等 待 ， 直 到 只 有 一 个 非 守 护 的 线程 执行 ， 注 意 此 时 
HotSpot VM 仍然 可 用 ; 

(2) 调用 java.lang.Shutdown.shutdown () 方法 ， 它 会 调用 Java 上 
的 shutdown 钓 子 方法 ， 如 果 finalization-on-exit 为 tue ， 则 运行 Java 对 象 
的 finalizer; 

(3) 运行 HotSpot VM 上 的 shutdown 钧 子 (通过 JVM_OnExit () 
TEAR) ， 停 止 以 下 线程 : 性 能 分 析 器 、 统 计数 据 抽样 器 、 监 控 线程 及 
垃圾 收集 器 线程 。 发 出 状态 事件 通知 JVMTI， 然 后 关闭 JVMTI、 停 止 
信号 线程 ; 

(4) 调用 HotSpot 的 JavaThread: : exit () 方法 释放 JNI 处 理 块 ， 
移出 保护 页 ， 并 将 当前 线程 从 已 知 线程 队列 中 移 除 。 从 这 时 起 ， 
HotSpot VM 就 无 法 执行 任何 Java 代 码 了 ，) 

(5) 停止 HotSpot VM 线程 ， 将 遗留 的 HotSpot VM 线程 带 到 安全 
点 兵 停止 JIT 编译 器 线程 ，; 

(6) 停止 追踪 JNI，HotSpot VM 及 JVMTI 屏 障 ; 

(7) 为 那些 仍然 以 本 地 代码 运行 的 线程 设置 标记 “vm exited”; 

(8) 删除 当前 线程 ; 


(9) 删除 或 移 除 所 有 的 输入 /输出 流 ， 释 放 PerfMemory (性 能 统 
计 内 存 ) 资源 ; 
(10) 最 后 返回 到 调用 者 。 

从 上 面 的 介绍 来 看 ， 整 个 过 程 可 以 理解 为 ，Launcher 从 启动 到 结束 
的 整个 执行 过 程 ， 成 功 启动 Launcher 后 ， 首 先进 入 到 Launcher 的 启动 函 
数 中 ， 这 一 点 和 Java 程 序 已 iyang，Launcher 的 启动 图 数 同样 也 是 main 

() o main O 图 数 的 主要 任务 是 负责 创建 运行 环境 ， 以 及 启动 一 个 
全 新 的 线程 去 执行 JVM 的 初始 化 和 调用 Java 程 序 的 main Q 方法 。 

当 main () 图 数 成 功 创建 运行 后 ， 就 会 启动 一 个 全 新 的 线程 去 调 
用 JavaMain () PRX, MJavaMain () 国 数 的 主要 任务 是 负责 调用 
InitiallizeJVM () 函数 。InitiallizeJVM () 函数 负责 JVM 初 始 化 的 相关 
工作 ,但 InitiallizeJVM () 函数 本 身 却 并 不 具备 初始 化 JVM 的 能 力 ， 而 
SA CAAA AINI CreatelavaVM () 去 完成 真正 意义 上 的 JVM 
初始 化 。 

当 JVM 初 始 化 完成 后 ，Launcher 接 着 调用 LoadClass () bk 2X #0 
GetStaticMethodId () 图 数 ， 分 别 获 取 Java 程 序 的 启动 类 和 启动 方法 。 
当 执 行 完 这 两 个 步骤 后 ，Launcher 就 会 调用 本 地 函数 
jni CallStaticMethod () 执行 Java 程 序 的 main () 方法 。 

最 后 Launcher 还 会 调用 本 地 函数 jni_DetachCurrentThread () 断 开 
与 主线 程 的 链接 。 当 成 功 与 主线 程 断 开 连接 后 ，Launcher 就 会 一 直 等 待 
程序 中 所 有 的 非 守 护 线程 (non-daemonthread) 全 部 执行 结束 ， 然 后 调 
FAAS HH ZXjni DestroyJavaJVM () 对 JVM 执 行销 毁 。 在 JDK1.2 之 前 ， 
只 有 主线 程 才 允 许 对 JVM 执 行销 毁 ， 而 在 这 之 后 ， 非 主线 程 也 允许 对 
JVM 执 行销 毁 。 

7.2.3 JVM 架 构 模 型 与 执行 引擎 

HotSpot YM 运行 时 系统 解析 命令 行 选项 ， 并 据 此 配置 HotSpot 
VM。 其 中 一 些 选项 供 HotSpot VM 启动 器 使 用 ， 例 如 指定 选择 哪个 JIT 


编译 器 、 选 择 何 种 垃圾 收集 器 等 ， 还 有 一 些 经 启动 器 处 理 后 传 给 启动 
的 HotSpot VM， 例 如 制定 Java 扒 的 大 小 。 


命令 行 选项 主要 有 3 类 : 标准 选项 (Standard Option) 、 非 标准 选 
项 (NonStandard Option) 和 非 稳定 选项 (Developer Option) 。 标 准 选 
项 是 Java Virtual Machine Specification 要 求 所 有 Java 虚 拟 机 都 必须 实现 的 
选项 ， 它 们 在 发 行 版 之 间 保 持 稳定 ， 但 也 可 能 在 后 续 的 发 行 版 中 被 废 
除 。 非 标准 选项 《以 -又 为 前 缀 ) 不 保证 、 也 不 强制 所 有 JVM 实 现 都 必 
须 支持 ， 它 可 能 未 经 通知 就 在 Java SDK 发 行 版 之 间 发 生 更 改 。 非 稳定 
选项 (以 -XX 为 前 级) 通常 是 为 了 特定 需要 而 对 JVM 的 运行 进行 校正 ， 
并 且 可 能 需要 有 系统 配置 参数 的 访问 权限 。 和 非 标准 选项 一 样 ， 非 稳 
定 选 项 也 可 能 不 经 通知 就 在 发 行 版 之 间 发 生变 动 。 

命令 行 选项 用 于 控制 HotSpot VM 的 内 部 变量 ， 每 个 变量 都 有 类 型 
和 默认 值 。 对 于 内 部 变量 为 布尔 类 型 的 选项 来 说 ， 只 要 在 HotSpot VM 
命令 行 上 添加 或 去 掉 它 就 可 以 控制 这 些 变 量 。 对 于 带 有 布尔 标记 的 非 
稳定 选项 来 说 ， 选 项 名 前 的 + 或 -表示 true 或 false， 用 以 开启 或 关闭 特定 
BY HotSpot VM 特性 或 参数 。 例 如 ，-XX: +AggressiveOpts 设 置 某 个 
HotSpot 内 部 布尔 变量 为 true 以 开启 额外 的 性 能 优化 ， 反 之 ， 如 果 设 置 
为 false， 则 关闭 额外 的 性 能 优化 。 除 了 布尔 标记 ， 还 有 一 类 带 有 附加 
选项 的 非 稳 定 选 项 ， 形 如 -XX: OptionName= < N > 。 几 乎 所 有 附加 选 
项 为 整数 的 非 稳定 选项 ， 整 数 后 面 都 可 以 接 后 缀 k，m，g， 表 示 干 、 百 
万 及 十 亿 。 


7.2.4 解释 器 与 JIT 编 译 器 


HotSpot VM 支持 JIT 编 译 器 的 动态 优化 ， 可 以 在 Java 应 用 运行 时 制 
定 优化 策略 ， 并 依据 底层 系统 架构 生成 高 效 的 本 地 机 器 指令 。 这 一 点 
证 明 HotSpot VM 架构 极 富 特 点 且 功 能 强大 ， 可 以 满足 高 性 能 和 高 扩展 

随 着 HotSpot VM 的 日 渐 成 熟 、 运 行 时 环境 的 不 断 改 进 和 垃圾 收集 
器 的 多 线程 化 ， 即 便 是 最 大 规模 的 计算 机 系统 ， 它 也 可 以 充分 利用 资 
源 ， 实 现 高 扩展 性 。 

在 HotSpot VM 内 部 ，JIT 编 译 器 (Client 或 Server) 和 垃圾 收集 器 
(Serial、Throughput、CMS 或 G1) 都 是 可 插 拔 的 。HotSpot VM 运行 时 
系统 为 HotSpot JIT 编 译 器 和 垃圾 收集 器 提供 服务 和 通用 API。 此 外 ， 它 
还 为 VM 提供 启动 、 线 程 管理 、JNI (Java 本 地 接口 ) 等 基本 功能 。 


7.2.5 类 加 载 机 制 


任何 一 个 类 型 在 使 用 之 前 都 必须 经 历 完 整 的 加 载 、 连 接 和 初始 化 3 
个 类 加 载 步骤 。 一 旦 这 3 个 步骤 完成 ， 这 个 类 就 可 以 随时 被 使 用 ， 开 发 
人 员 可 以 在 程序 中 访问 和 调用 它 的 静态 类 成 员 信息 ， 比 如 静态 字段 、 
静态 方法 等 ， 或 者 使 用 new 天 键 字 为 其 创建 对 象 实 例 。 

简单 来 说 ， 类 加 载 器 的 主要 任务 就 是 根据 一 个 类 的 全 路 径 名 来 读 
取 此 类 的 二 进 制 字 节 流 到 JVM 内 部 ， 然 后 转换 为 一 个 与 目标 类 对 应 的 
java.lang.Class 对 象 实 例 。Java 设 计 者 们 当初 在 涉及 类 加 载 器 的 时 候 ， 并 
没有 考虑 将 它 绑 定 在 JVM 内 部 ， 这 样 做 的 好 处 是 能 够 更 加 灵活 和 动态 
地 执行 类 加 载 操作 。 

JVM 支 持 两 种 类 型 的 类 加 载 器 ， 分 别 为 引导 类 加 载 器 (Bootstrap 
Classloader) 和 自 定 义 类 加 载 器 (User-Defined Classloader) ， 我 们 较 
为 常用 的 是 三 个 类 加 载 器 ， 分 别 是 Bootstrap ClassLoader 、 
ExtClassLoader、 AppClassLoadero 


Bootstrap CloassLoader 也 称 之 为 启动 类 加 载 器 ， 它 由 C++ 语 言 编写 
并 贬 套 在 JVM 内 部 ， 主 要 负责 加 载 “JAVA_HOME/lib” 目 录 中 的 所 有 类 
型 ， 或 者 由 选项 “-Xbootclasspath” 指 定 路 径 中 的 所 有 类 型 。 
ExtClassLoader 和 AppClassLoader 派 生 于 ClassLoader， 并 且 都 是 来 用 Java 
语言 编写 的 ， 前 者 主要 负责 加 载 “JAVA_HOMEylib/ext” 扩 展 目录 中 的 所 
有 类 型 ， 后 者 则 主要 负责 加 载 ClassPath 目 录 中 的 所 有 类 型 。 

如 果 当 前 的 类 加 载 器 无 法 满足 我 们 的 需求 时 ， 便 可 以 在 程序 中 编 
写 自 定义 类 加 载 器 来 重新 定义 类 的 加 载 规 则 ， 以 便 实 现 一 些 自 定义 的 
处 理 逻 辑 。 在 程序 中 编写 一 个 自 定 义 类 加 载 器 是 一 件 非 常 简单 的 任 
务 ， 只 需要 继承 抽象 类 ClassLoader 并 重 写 findClass () 方法 即 可 。 当 编 
写 好 自 定义 类 加 载 器 后 ， 便 可 以 在 程序 中 调用 loadClass ( 方法 来 实 
现 类 加 载 操 作 。 

7.2.5.1 双亲 委托 模式 

Java 虚 拟 机 的 设计 者 们 通过 一 种 被 称 之 为 双亲 委托 模型 (Parents 
Delegation Model) 的 委托 机 制 来 约定 类 加 载 器 的 加 载 机 制 。 按 照 双亲 
委托 模型 的 规则 ， 除 了 局 动 类 加 载 器 之 外 ， 程 序 中 每 一 个 类 加 载 器 都 
应 该 拥有 一 个 超 类 加 载 器 ， 比 如 AppClassLoader 的 超 类 加 载 器 就 是 


ExtClassLoader, ， 而 开发 人 员 自 己 编写 的 自 定 义 类 加 载 器 的 超 类 就 是 
AppClassLoader， 那 么 当 一 个 类 加 载 器 接收 到 一 个 类 加 载 任务 的 时 候 ， 
它 并 不 会 立即 展开 加 载 ， 而 是 将 加 载 任务 委派 给 它 的 超 类 加 载 器 去 执 
行 ， 每 一 层 的 类 加 载 器 都 来 用 相同 的 方式 ， 直 至 委派 给 顶层 的 启动 类 
加 载 器 为 止 。 如 果 超 类 加 载 器 无 法 加 载 委托 给 它 的 类 时 ， 便 会 将 类 的 
加 载 任务 退回 给 它 的 下 一 级 类 加 载 器 去 执行 加 载 。 

使 用 双 杀 委托 模型 的 优点 就 是 能 够 有 效 地 确保 一 个 类 的 全 局 唯一 
性 ， 当 程序 中 出 现 多 个 相同 名 字 的 类 名 的 时 候 ， 比 如 都 叫 
hik.michael.Test， 类 加 载 器 在 执行 加 载 的 时 候 ， 始 终 都 会 只 加 载 其 中 的 
某 一 个 类 ， 不 会 2 个 类 都 执行 加 载 ， 如 果 想 通过 defindClass () 方法 进 
行 显 式 的 加 载 ，JVM 会 抛 出 异常 。 

注意 ， 由 于 Java 虚 拟 机 规范 并 没有 明确 要 求 类 加 载 器 的 加 载 机 制 | 一 
定 要 使 用 双 杀 委派 模型 ， 只 是 建议 采用 这 种 方式 而 已 。 比 如 在 Tomcat 
中 ， 类 加 载 器 所 采用 的 加 载 机 制 就 和 传统 的 双亲 委托 模型 有 一 定 区 
别 ， 当 默认 的 类 加 载 器 接收 到 一 个 类 的 加 载 任务 时 ， 首 先 会 由 它 自 动 
加 载 ， 当 它 加 载 失 败 时 ， 才 会 将 类 的 加 载 任务 委派 给 它 的 超 类 加 载 器 
去 执行 ， 这 也 是 Servlet 规 范 推荐 的 一 种 做 法 。 

7.2.5.2 类 加 载 阶段 

类 的 加 载 阶 段 就 是 由 类 加 载 器 负责 根据 一 个 类 的 全 名 来 读 取 此 类 
的 二 进 制 字 节 流 到 JVM 内 部 ， 并 存储 在 运行 时 内 存 区 中 的 方法 区 内 ， 
然后 将 其 转换 为 一 个 与 目标 类 型 对 应 的 java.lang.Class 对 象 实 例 (Java 虚 
拟 机 规范 并 没有 明确 要 求 一 定 要 存储 在 Java 扒 区 中 ， 因 此 HotSpot VM 
选择 将 Class 对 象 存储 在 方法 区 内 ) ， 这 个 Class 对 象 在 日 后 就 会 作为 方 
法 区 中 该 类 的 各 种 数据 的 访问 入 口 。 而 链接 阶段 要 做 的 事情 就 是 将 已 
经 加 载 到 JVM 中 的 二 进 制 字 节 流 的 类 数据 信息 合并 到 JVM 的 运行 时 状 
态 中 ， 然 而 连接 阶段 则 由 验证 、 准 备 和 解析 3 个 阶段 构成 ， 其 中 验证 阶 
段 的 主要 任务 就 是 验证 类 数据 信息 是 否 符合 JVM 规 范 ， 是 否 是 一 个 有 
效 的 字 节 码 文件 ， 而 验证 的 内 容 涵 盖 了 类 数据 信息 的 格式 验证 、 语 义 
分 析 、 操 作 验 证 等 ; 准备 阶段 的 主要 任务 就 是 为 类 中 的 所 有 静态 变量 
分 配 内 存 空间 ， 并 为 其 设置 一 个 初始 值 (由 于 还 没有 产生 对 象 ， 因 此 
实例 变量 将 不 在 此 操作 范围 内 ) ; 而 解析 阶段 的 主要 任务 就 是 将 常量 
闻 中 所 有 的 符号 引用 全 部 转换 为 直接 引用 ， 不 过 Java 虚 拟 机 规范 并 没有 


明确 要 求解 析 阶 段 一 定 要 按照 顺序 执行 ， 因 此 解析 阶段 可 以 等 到 初始 
化 之 后 再 执行 。 类 加 载 过 程 中 的 最 后 一 个 阶段 就 是 初始 化 ， 在 这 个 阶 
段 中 ，JVM 会 将 一 个 类 中 所 有 被 static 关 键 字 标 识 的 代码 统统 执行 一 
遍 ， 如 果 执行 的 是 静态 变量 ， 那 么 就 会 使 用 用 户 指 定 的 值 覆 盖 掉 之 前 
在 准备 阶段 中 JVM 为 其 设置 的 初始 值 ， 当 然 如 果 程序 中 疫 有 为 静态 变 
量 显 式 指定 赋值 操作 ， 那 么 所 持 有 的 值 仍 然 是 之 前 的 初始 值 ， 反 之 如 
果 执 行 的 是 static 代 码 块 ， 那 么 在 初始 化 阶段 中 ，JVM 就 将 会 执行 static 
代码 块 中 定义 的 所 有 操作 。 

Java 虚 拟 机 规范 在 类 加 载 和 连接 的 时 机 上 提供 了 较 大 的 灵活 性 ， 但 
Java 虚 拟 机 规范 却 明 确 规定 了 类 的 初始 化 时 机 ， 也 就 是 说 ， 一 个 类 或 者 
接口 应 该 在 首次 主动 使 用 时 执行 初始 化 操作 。 


7.2.6 虚拟 机 


7.2.6.1 32 位 VS64 位 


相对 于 传统 的 32 位 虚拟 机 ，64 位 虚拟 机 所 具备 的 最 大 优势 就 是 可 
以 访问 大 内 存 ，32 位 虚拟 机 做 的 最 大 可 用 内 存 空 间 被 限定 在 了 4GB， 
并 且 Java 堆 区 的 大 小 如 果 是 在 Windows 平 台 下 最 大 只 能 设置 到 1.5GB， 
而 在 Linux 平 台 下 最 大 也 只 能 设置 到 2GB~3GB 的 上 限 ， 也 就 是 说 ， 
Java 堆 区 的 内 存 大 小 设置 还 需要 依赖 于 具体 的 操作 平台 。 既 然 32 位 虚拟 
机 无 法 满足 大 内 存 消耗 的 应 用 场景 ， 那 么 64 位 虚拟 机 的 出 现 则 是 顺 理 
成 章 的 ，64 位 虚拟 机 之 所 以 能 够 访问 大 内 存 ， 是 因为 其 采用 了 64 位 的 
外 针 架构 ， 这 也 是 寻 址 访问 大 内 存 的 关键 要 素 。 

在 JDK1.6 Update14 版 本 之 前 ，64 位 虚拟 机 的 综合 性 能 表现 实际 上 
是 不 如 32 位 虚拟 机 的 ， 这 主要 是 因为 OOPS (Ordinary Object Pointers， 
普通 对 象 指针 ) 从 32 位 膨胀 到 64 位 后 ，CPU Cache Line 中 的 可 用 OOPS 
变 少 ， 这 样 一 来 就 会 直接 影响 并 降低 CPU 的 缓存 使 用 率 ， 这 就 是 64 位 
虚拟 机 在 性 能 上 之 所 以 落后 于 32 位 虚拟 机 的 主要 原因 。 其 次 由 于 部 署 
在 64 位 虚拟 机 上 的 性 能 都 需要 用 到 大 内 存 ， 尤 其 是 互联 网 项 目 ， 经 常 
需要 使 用 多 达 几 十 乃至 几 百 GB 的 内 存 ， 这 对 于 传统 的 32 位 虚拟 机 将 无 
法 承载 ， 只 能 依靠 64 位 虚拟 机 去 支撑 。 但 是 管理 这 么 大 的 内 存 开 销 对 
于 GC 来 说 将 会 是 一 场 非常 严峻 的 考验 ， 甚 至 很 有 可 能 去 导致 GC 在 执行 
内 存 回收 期 间 消耗 更 长 的 时 间 ， 同 时 也 意味 着 工作 线程 的 等 待 时 间 将 


会 延长 。 随 着 如 今 64 位 虚拟 机 的 逐渐 成 熟 ， 指 针 压 缩 将 会 通过 对 齐 补 
白 等 操作 将 64 位 指针 压缩 为 32 位 ， 以 此 改善 CPU 缓 存 使 用 率 达 到 提升 
64 位 虚拟 机 运行 性 能 的 目的 。 

7.2.6.2 JVM 容 错 示 例 

Java 的 运行 时 系统 也 加 入 了 容错 机 制 ， 其 中 一 个 方法 就 是 保证 Java 
虚拟 机 能 够 支持 现役 复制 (active replication) 机 制 |。 

现役 的 复制 本 质 上 要 求 复 制品 服务 器 像 一 个 确定 的 、 有 限 状态 的 
机 器 。Java 虚 拟 机 就 是 这 样 一 个 非常 好 的 角色 。 遗 憾 的 是 ，JVM 并 不 总 
是 确定 的 ， 有 很 多 原因 会 引起 不 确定 行为 ， 具 体 原 因 有 如 下 三 点 。 

(1) JVM 能 够 执行 本 地 代码 (Native Code) ， 即 JVM 外 部 的 代 
码 ， 它 向 JVM 提 供 接 口 。JVM 对 待 本 地 代码 就 像 对 待 一 个 黑 盒 子 ， 也 
就 是 说 它 只 能 见 到 接口 ， 不 知道 调用 引起 的 潜在 的 不 确定 性 为 。 
此 ， 为 了 JVM 能 够 主动 复制 ， 不 应 该 保证 本 地 代码 的 行为 是 确定 的 。 

(2) 输入 数据 可 能 遭受 到 不 确定 性 。 例 如 ， 一 个 能 被 多 个 线程 操 
作 的 共享 变量 ， 当 人 允许 线程 并 发 访问 时 ， 可 能 被 JVM 转 换 成 不 同 的 实 
例 。 为 控制 这 种 行为 ， 共 享 数据 至 少 应 该 用 锁 来 保护 。 事 实证 明 ，Java 
运行 时 环境 没有 始终 坚持 这 个 原则 ， 尽 管 其 支持 多 线程 。 

(3) 在 有 故障 时 ， 不 同 的 虚拟 机 产生 不 同 的 输出 ， 表 明 机 器 被 复 
制 了 。 当 这 些 虚 拟 机 需要 返回 到 相同 的 状态 时 ， 这 种 不 同 会 引起 问 
题 。 如 果 能 够 假定 所 有 输出 都 是 可 以 被 重 放 的 (be replayed) 或 者 是 可 
测试 的 ， 以 至 于 能 够 检测 输出 是 否 在 冲突 前 产生 ， 间 题 就 能 变 得 简 
单 。 为 了 允许 复制 品 服务 器 能 够 决定 是 否 必 须 重 复 执行 一 个 操作 ， 这 
种 假设 是 必需 的 ， 

实践 表明 ， 把 JVM 变 成 确定 的 有 限 状 态 机 并 不 简单 。 一 个 需要 解 
决 的 问题 是 复制 服务 器 可 能 和 主 服务 器 存在 冲突 。 一 个 可 行 的 方案 是 
让 服务 器 依据 ”primary-backup” 策 略 工 作 ， 在 这 种 工作 方案 中 ， 一 个 服 
务 器 协调 所 有 需要 执行 的 动作 ， 并 一 直 指 示 备 份 服务 器 做 相同 的 工 
作 ， 现 有 很 多 分 布 式 系统 大 多 都 是 基于 这 样 的 方式 来 做 调度 服务 器 的 
主 备 逻辑 。 

值得 注意 的 是 ， 尽 管 依照 “primary-backup” 策 略 组 织 了 复制 服务 
器 ， 还 需要 处 理 现役 服务 器 的 复制 ， 即 使 每 个 复制 品 以 相同 的 程序 执 


行 相 同 的 操作 ， 我 们 也 不 可 能 完全 确保 主 备 服务 器 不 同时 崩溃 的 情况 


o 


7.3 垃圾 回收 机 制 相 关 


7.3.1 GC 相关 概念 


7.3.1.1 GC 的 作用 

GC (Garbage Collection， 垃 圾 收集 器 ) 就 是 JVM 中 自动 内 存 管理 
机 制 的 具体 实现 。 在 HotSpot 中 ，GC 的 工作 任务 主要 可 以 划分 为 两 大 
块 ， 分 别 是 内 存 的 动态 分 配 和 垃圾 回收 。 而 在 内 存 执行 分 配 之 前 ，GC 
首先 会 对 内 存 空间 进行 划分 ， 考 虑 到 JVM 中 存活 对 象 的 生命 周期 会 具 
有 两 极 化 ， 因 此 应 该 采取 不 同 的 垃圾 收集 策略 ， 分 代 收 集 由 此 诞生 。 
目前 几乎 所 有 的 GC 都 是 采用 分 代 收 集 算法 执行 垃圾 回收 的 ， 所 以 Java 
堆 区 如 果 还 要 更 进一步 细 分 的 话 ， 还 可 以 划分 为 新 生 代 (YoungGen) 
MEER (OldGen) ， 其 中 新 生 代 内 又 可 以 划分 为 Eden 空 间 、From 
Survivor 空 间 和 To Survivor 空 间 ， 换 句 话 说， 内 存 空间 究竟 应 该 如 何 划 
完全 依赖 于 GC 的 设计 。 当 内 存 空间 划分 完成 后 ，GC 就 可 以 为 新 对 象 
分 配 内 存 空 间 ， 并 区 分 出 存储 在 内 存 中 的 对 象 哪些 是 存活 的 ， 哪 些 是 
已 经 死亡 了 的 ， 如 果 对 象 已 经 死亡 ， 那 么 救 可 以 将 其 标记 为 垃圾 。 为 
了 避免 内 存 溢出 ，GC 就 会 释放 掉 无 用 对 象 所 占用 的 内 存 空 间 ， 便 于 有 
足够 的 可 用 内 存 空间 分 配给 新 的 对 象 实例 。 

一 般 来 说 当 内 存 空间 中 的 内 存 消耗 达到 了 一 定 阅 值 的 时 候 ，GC 就 
会 执行 垃圾 回收 ， 而 且 回 收 算法 必须 非常 精确 ， 一 定 不 能 造成 内 存 中 
存活 的 对 象 被 错误 回收 掉 ， 也 不 能 造成 已 经 死亡 的 对 象 没有 被 及 时 地 
回收 掉 。 而 且 GC 执 行内 存 回 收 的 时 候 应 该 做 到 高 效 ， 不 应 该 导致 应 用 
程序 出 现 长 时 间 的 暂停 ， 以 及 避免 产生 内 存 人 泵 片 。 不 过 当 GC 执 行 垃 专 
回收 时 ， 不 可 避免 地 会 产生 一 些 内 存 人 碎片 ， 因 为 被 回收 的 内 存 空间 极 
有 可 能 是 一 些 不 连续 的 内 存 块 ， 这 样 一 来 将 会 导致 没有 足够 的 连续 可 
用 内 存 分 配给 较 大 的 对 象 ， 不 过 可 以 使 用 讨 缩 算法 消除 内 存 人 碎片 。 

淘宝 的 技术 团队 对 Java 虚 拟 机 的 优化 工作 其 实 早 已 不 是 停留 在 简单 
的 参数 调整 上 面 ， 而 是 充分 结合 了 企业 自身 的 业务 特点 以 及 实际 的 应 
用 场景 ， 在 OpenJDK 的 基础 之 上 通过 修改 大 量 的 HotSpot 源 人 代码， 深度 


定制 了 淘宝 专属 的 高 性 能 Linux 虚 拟 机 TAOBAOVM。 从 严格 意义 上 来 
说 ， 在 提升 Java 虚 拟 机 性 能 的 同时 ， 严 重 依 赖 于 物理 CPU 类 型 。 也 就 是 
说 ， 部 署 有 TAOBAOVM 的 服务 器 中 ，CPU 全 都 是 清一色 的 Intel CPU， 
且 编 译 手段 采用 的 是 Intel C/CPP Compiler 进 行 编译 ， 以 此 对 GC 性 能 进 
行 提升 。 除 了 优化 编译 效果 外 ，TAOBAOVM 还 使 用 crc32 指 令 实现 
JVM intrinsic 降 低 JNI 的 调用 开销 。 

除了 在 性 能 优化 方面 下 足 了 功夫 ，TAOBAOVM 还 在 HotSpot 的 基 
础 之 上 大 幅度 扩充 了 一 些 特定 的 增强 实现 ， 比 如 创新 的 GCIH (GC 
invisible heap) 技术 实现 off-heap， 这 样 一 来 就 可 以 将 生命 周期 较 长 的 
Java 对 象 从 heap 中 移 至 heap 之 外 ， 并 且 GC 不 能 管理 GCIH 内 部 的 Java 对 
象 ， 这 样 做 最 大 的 好 处 就 是 降低 了 GC 的 回收 频率 以 及 提升 了 GC 的 回收 
效率 ， 并 且 GCIH 中 的 对 象 还 能 够 在 多 个 Java 虚 拟 机 进程 中 实现 共享 。 
其 他 补充 技术 还 有 利用 PMU hardware 的 Java profiling tool 和 诊断 协助 功 
能 等 。 

在 许多 情况 下 ，GC 不 应 该 成 为 影响 系统 性 能 的 瓶颈 ， 可 以 根据 以 
下 6 点 来 评估 一 款 GC 的 性 能 ， 如 下 所 示 。 

mg Aure: 程序 的 运行 时 间 (程序 的 运行 时 间 + 内 存 回收 的 时 
间 ) ; 

m 垃圾 收集 开销 : 吞吐 量 的 补 数 ， 垃 圾 收集 器 所 占 时 间 与 总 时 间 的 
比例 ; 

四 暂停 时 间 : 执行 垃圾 收集 时 ， 程 序 的 工作 线程 被 暂停 的 时 间 ; 

m 收集 频率 : 相对 于 应 用 程序 的 执行 ， 收 集 操作 发 生 的 频率 ; 

m 堆 空间 : Java 推 区 所 占 的 内 存 大 小 ; 

m 快速 : 一 个 对 象 从 诞生 到 被 回收 所 经 历 的 时 间 。 

7.3.1.2 评价 GC 策略 的 指标 

一 个 垃圾 回收 器 的 应 用 场景 会 有 它 的 特定 性 ， 我 们 需要 有 一 些 标 
准 来 帮助 我 们 评价 一 个 垃圾 回收 器 ， 我 们 可 以 用 以 下 指标 评价 一 个 垃 
圾 回收 器 的 好 坏 。 

m Aum: 指 在 应 用 程序 的 生命 周期 内 ， 应 用 程序 所 花费 的 时 间 和 
系统 总 运行 时 间 的 比值 。 系 统 总 运行 时 间 = 应 用 程序 耗 时 +GC 耗 时 。 如 


果 系 统 运行 了 100min ，GC 耗 时 lmin， 那 么 系统 的 吞吐 量 就 是 (100- 
1) /100=99%6。 

e 垃圾 回收 器 负载 : 和 吞吐 量 相 反 ， 垃 圾 回收 器 负载 指 来 记 回收 器 
耗 时 与 系统 运行 总 时 间 的 比值 。 

m 停顿 时 间 : 指 垃圾 回收 器 正在 运行 时 ， 应 用 程序 的 暂停 时 间 。 对 
于 独占 回收 器 而 言 ， 停 顿时 间 可 能 会 比较 长 。 使 用 并 发 的 回收 器 时 ， 
由 于 垃圾 回收 器 和 应 用 程序 交替 运行 ， 程 序 的 停顿 时 间 会 变 短 ， 但 
是 ， 由 于 其 效率 很 可 能 不 如 独占 垃圾 回收 器 ， 故 系统 的 吞吐 量 可 能 会 
较 低 。 

mw 垃圾 回收 频率 : 指 垃圾 回收 器 多 长 时 间 会 运行 一 次 。 一 般 来 说 ， 
对 于 固定 的 应 用 而 言 ， 垃 圾 回收 器 的 频率 应 该 是 越 低 越 好 。 通 常 增 大 
堆 空 间 可 以 有 效 降 低 垃圾 回收 发 生 的 频率 ， 但 是 可 能 会 增加 回收 产生 
的 停顿 时 间 。 

e 反应 时 间 : 指 当 一 个 对 象 称 为 垃圾 后 多 长 时 间 内 ， 它 所 占据 的 内 
存 空间 会 被 释放 。 

me tED AC: 不 同 的 垃圾 回收 器 对 堆 内 存 的 分 配方 式 是 不 同 的 。 一 个 
展 好 的 垃圾 收集 器 应 该 有 一 个 合理 的 堆 内 存 区 间 划 分 。 

7.3.1.3 指针 碰撞 (Bump the Pointer) & 空 闲 列 表 (Free List) 


在 HotSpot 虚 拟 机 中 ， 使 用 两 种 技术 加 快 内 存 的 分 配 。 一 个 被 称 为 
“指针 碰撞 (bump-the-pointer) ”， 另 外 一 个 被 称 为 “TLABs (线程 本 地 
分 配 缓冲 ) ”。 这 两 种 技术 分 别 是 什么 呢 ? 

我 们 知道 ，Java 是 一 门面 向 对 象 的 编程 语言 ，Java 程 序 运 行 过 程 中 
无 时 无 刻 都 有 对 象 被 创建 出 来 。 虚 拟 机 遇 到 一 条 new 指 令 时 ， 先 去 检查 
这 个 指令 的 参数 是 否 能 在 常量 闻 中 定位 到 一 个 类 的 符号 引用 ， 并 且 检 
查 这 个 符号 引用 代表 的 类 是 否 已 被 加 载 、 解 析 和 初始 化 过 。 如 果 没 
有 ， 那 必须 先 执行 相应 的 类 加 载 过 程 。 在 类 加 载 查 通过 后 ， 接 下 来 虚 
拟 机 将 为 新 生 对 象 分 配 内 存 。 对 象 所 需 内 存 的 大 小 在 类 加 载 完 成 后 便 
可 完全 确定 (如何 确 定 在 下 一 节 对 象 内 存 布局 时 再 详细 讲解 ) ， 为 对 
象 分 配 空间 的 任务 具体 便 等 同 于 一 块 确 定 大 小 的 内 存 从 Java 扒 中 划分 出 
R, GARIE? 假设 Java 扒 中 内 存 是 绝对 规整 的 ， 所 有 用 过 的 内 存 都 被 
放 在 一 边 ， 空 闪 的 内 存 被 放 在 另 一 边 ， 中 间 放 着 一 个 指针 作为 分 界 点 
的 指示 器 ， 那 所 分 配 内 存 就 仅仅 是 把 那个 指针 向 空间 空间 那 边 挪动 一 


段 与 对 象 大 小 相等 的 距离 ， 这 种 分 配方 式 称 为 “指针 碰撞 ”(Bump The 
Pointer) 。 

指针 碰撞 技术 跟踪 分 配给 Eden 区 上 最 新 的 对 象 ， 该 对 象 将 位 于 
Eden 区 的 顶部 。 如 果 之 后 有 一 个 对 象 被 创建 ， 只 需 检 查 Eden 区 是 否 
足够 大 的 空间 存放 该 对 象 。 如 果 空 间 够 用 ， 它 将 被 放置 在 Eden 区 ， 存 
放 在 空间 的 顶部 。 因 此 ， 在 创建 新 对 象 时 ， 只 需 检查 最 后 被 添加 对 
象 ， 看 是 否 还 有 更 多 的 内 存 空间 允许 分 配 。 然 而 ， 如 果 考 虑 多 线程 的 
环境 ， 则 是 另外 一 种 情况 。 为 了 实现 多 线程 环境 下 ， 在 Eden 区 线程 安 
全 的 去 创建 保存 对 象 ， 那 么 必须 加 锁 ， 因 此 性 能 会 下 降 。 在 HotSpot 虚 
拟 机 中 TLABs 能 够 解决 这 一 问题 。 它 允许 每 个 线程 在 Eden 区 有 自己 的 
一 小 块 私有 空间 。 因 为 每 一 个 线程 只 能 访问 自己 的 TLAB， 所 以 在 这 个 
区 域 甚至 可 以 使 用 无 锁 的 指针 碰撞 技术 进行 内 存 分 配 。 

如 果 Java 扒 中 的 内 存 并 不 是 规整 的 ， 已 被 使 用 的 内 存 和 空闲 的 内 存 
相互 交错 ， 那 就 没有 办 法 简单 地 进行 指针 碰撞 了 ， 虚 拟 机 就 必须 维护 
一 个 列表 ， 记 录 上 哪些 内 存 块 是 可 用 的 ， 在 分 配 的 时 候 从 列表 中 找到 
一 块 足够 大 的 空间 划分 给 对 象 实 例 ， 并 更 新 列表 上 的 记录 ， 这 种 分 配 
方式 称 为 “ 空 闪 列表 ” (Free List) o 选择 哪 种 分 配方 式 由 Java 扒 是 否 规 
整 决 定 ， 而 Java 堆 是 否 规整 又 由 所 采用 的 垃圾 收集 器 是 否 带 有 压缩 整理 
功能 决定 。 因 此 在 使 用 Serial、ParNew 等 带 Compact 过 程 的 收集 器 时 ， 
系统 采用 的 分 配 算 法 是 指针 碰撞 ， 而 使 用 CMS 这 种 基于 Mark-Sweep 算 
法 的 收集 器 时 (说 明 一 下 ，CMS 收 集 器 可 以 通过 
UseCMSCompactAtFullCollection 或 CMSFullGCsBeforeCompaction 来 整 
理 内 存 ) ， 就 通常 采用 空 内 列表 。 

除了 如 何 划 分 可 用 空间 之 外 ， 还 有 另外 一 个 需要 考虑 的 问题 是 对 
象 创建 在 虚拟 机 中 是 非常 频繁 的 行为 ， 即 使 是 仪 仅 修改 一 个 指针 所 指 
向 的 位 置 ， 在 并 发 情况 下 也 并 不 是 线程 安全 的 ， 可 能 出 现 正 在 给 对 象 A 
分 配 内 存 ， 指 针 还 没 来 得 及 修改 ， 对 象 B 又 同时 使 用 了 原来 的 指针 来 分 
配 内 存 。 解 决 这 个 问题 有 两 个 方案 ， 一 种 是 对 分 配 内 存 空 间 的 动作 进 
行 同步 一 实际 上 虚拟 机 是 采用 CAS 配 上 失败 重 试 的 方式 保证 更 新 操作 
的 原子 性 ; 另外 一 种 是 把 内 存 分 配 的 动作 按照 线程 划分 在 不 同 的 空间 
之 中 进行 ， 即 每 个 线程 在 Java 扒 中 预先 分 配 一 小 块 内 存 ， 称 为 本 地 线程 
分 配 缓冲 ， (TLAB, Thread Local Allocation Buffer) ， 哪 个 线程 要 分 
配 内 存 ， 就 在 哪个 线程 的 TLAB 上 分 配 ， 只 有 TLAB 用 完 ， 分 配 新 的 


TLAB 时 才 需 要 同步 锁定 。 虚 拟 机 是 否 使 用 ITLAB， 可 以 通过 -XX: +- 
UseTLAB 参 数 来 设 定 。 内 存 分 配 完成 之 后 ， 虚 拟 机 需要 将 分 配 到 的 内 
存 空间 都 初始 化 为 零 值 〈 不 包括 对 象 头 ) ， 如 果 使 用 TLAB 的 话 ， 这 一 
个 工作 也 可 以 提前 至 TLAB 分 配 时 进行 。 这 步 操 作 保证 了 对 象 的 实例 字 
段 在 Java 代 码 中 可 以 不 赋 初 始 值 就 直接 使 用 ， 程 序 能 访问 到 这 些 字段 的 
数据 类 型 所 对 应 的 零 值 。 

7.3.1.4 年 轻 代 & 老 年 代 

虚拟 机 给 每 个 对 象 定义 了 一 个 对 象 年 龄 (Age) 计数 器 。 如 果 对 象 
在 Eden 出 生 并 经 过 第 一 次 Minor GC 后 仍然 存活 ， 并 且 能 被 Survivor 容 纳 
的 话 ， 将 被 移动 到 Survivor 空 间 中 ， 并 将 对 象 年 龄 设 为 1。 对 象 在 
Survivor 区 中 每 敖 过 一 次 Minor GC， 年 龄 就 增加 1 岁 ， 当 它 的 年 龄 增加 
到 一 定 程度 (默认 为 15 岁 ) 时 ， 就 会 被 晋升 到 老年 代 中 。 对 象 晋 升 老 
年 代 的 年 龄 阅 值 ， 可 以 通过 参数 -XX: MaxTenuringThreshold 来 设置 。 

针对 不 同年 龄 段 的 对 象 分 配 原 则 如 下 所 示 。 

(1) 对 象 优先 分 配 在 Eden 区 ， 如 果 Eden 区 没有 足够 的 空间 时 ， 虚 
拟 机 执行 一 次 Minor GC; 

(2) 大 对 象 直接 进入 老年 代 〈 大 对 象 是 指 需要 大 量 连续 内 存 空 间 
的 对 象 ) 。 这 样 做 的 目的 是 避免 在 Eden 区 和 两 个 Survivor 区 之 间 发 生 大 
量 的 内 存 拷贝 (新 生 代 采用 复制 算法 收集 内 存 ) ; 

(3) 长 期 存活 的 对 象 进 入 老年 代 。 虚 拟 机 为 每 个 对 象 定 义 了 一 个 
年 龄 计数 器 ， 如 果 对 象 经 过 了 1 次 Minor GC 那 么 对 象 会 进入 Survivor 
区 ， 之 后 每 经 过 一 次 Minor GC 那 么 对 象 的 年 龄 加 1， 知 道 达 到 阅 值 对 象 
进入 老年 区 ; 

(4) 动态 判断 对 象 的 年 龄 。 如 果 Survivor 区 中 相同 年 龄 的 所 有 对 
象 大 小 的 总 和 大 于 Survivor 空 间 的 一 半 ， 年 龄 大 于 或 等 于 该 年 龄 的 对 象 
可 以 直接 进入 老年 代 ; 

(5) 空间 均 大 Han 分 配 担保 。 小 ， 如 果 这 dlePromotio 每 次 进行 M 
个 值 大 于 老 nFailure 设 置 inor GC 时 ， 年 区 的 剩余 ， 如 果 true 则 JVM 会 计 
算 值 大 小 则 进 只 进行 Moni Survivor 区 移行 一 次 Ful tor GC， 如 果 至 老年 
区 的 1 GC， 如 果 false 则 进行 对 象 的 平 小 于 检查 Full GC。 

7.3.1.5 Full GC&Minor GC 


BJ f Minor GC 达 ， 所 以 大 一 次 “Min 工 作 原 理 如 多 数 对 象 在 or 
GC”。 图 7-1 所 示 。 年 轻 代 中 创建 新 创建 的 对 ， 然 后 消失 象 都 存放 在 。 
当 对 象 从 这 里 。 因 为 大 这 块 内 存 区 域 多 数 对 象 很 消失 时 ， 我 快 变 得 不 


们 说 发 生 


存活 对 象 


小 T 
threshold 


于 
threshold 
对 象 


图 7-1 Minor GC 工 作 原 理 图 

为 没有 变 得 它 更 大 的 规 “Full GC”) AAA, FR, GCCRERE 
了 。 活 下 来 的 年 轻 的 次 数 比 在 代 对 象 被 复 年 轻 代 的 少 。 制 到 这 里 。 对 
象 从 老年 这 块 内 存 区 域 代 消失 时 ， 我 一 般 大 于 年 们 说 “Majo 轻 代 。 因 r 
GC” (或 

除了 直接 调用 System.gc 外 ， 触 发 Full GC 执行 的 情况 有 如 下 四 种 。 

1. 旧 生 代 空间 不 足 

F 旧 生 代 空 ull GC 后 空间 间 只 有 在 新 仍然 不 足 ， 生 代 对 象 转 入 则 抛 
出 如 下 及 创建 为 大 错误 java.lan 对 象 、 大 数 g.OutOfMem 组 时 才 会 出 现 
oryError: Jav 不 足 的 现象 a heap spaceo ， 当 执行 

让 为 了 避免 对 象 在 新 生 以 上 两 种 状 代 多 存活 一 况 引 起 的 Ful 段 时 间 
即 不 要 1 GC， 调 优 时 创建 过 大 的 应 尽量 做 到 对 象 及 数组 。 让 对 象 在 
Minor GC 阶段 被 回收 、 


2.Permanet Generation 空 间 满 

的 G P Permanet 方 法 较 多 时 C。 如 果 经 过 ermGen spac Generation 
FH, Permanet G Full GC 仍 然 e。 存 放 的 为 一 eneration 可 回收 不 了 ， 那 些 
Class 的 信和 能 会 被 占 满 ， 么 JVM 会 抛 息 等 ， 当 系 在 未 配置 为 出 如 下 错误 
统 中 要 加 载 的 采用 CMS GC 信息 java.la 类 、 反 射 的 的 情况 下 会 
ng.OutOfMem 类 和 调用 执行 Full oryError: 

C 为 了 避免 MS GC, Perm Gen 占 满 造成 Full GC 现象 ， 可 采用 的 方 
法 为 增 大 Perm Gen 空 间或 转 为 使 用 

3.CMS GC 时 出 现 promotion failed 和 concurrent mode failure 

对 于 采用 CMS 进 行 旧 生 代 GC 的 程序 而 言 ， 尤 其 要 注意 GC 日 志 中 
是 否 有 Promotion Failed 和 Concurrent Mode Failure 两 种 状况 ， 当 这 两 种 
状况 出 现时 可 能 会 触发 Full GC. Promotion Failed 是 在 进行 Minor GC 
BY, Survivor Space 放 不 下 、 对 象 只 能 放 入 旧 生 代 ， 而 此 时 旧 生 代 也 放 
不 下 造成 的 ; concurrent mode failure 是 在 执行 CMS GC 的 过 程 中 同时 有 
对 象 要 放 入 旧 生 代 ， 而 此 时 旧 生 代 空 间 不 足 造成 的 。 

应 对 措施 为 增 大 survivorspace、 旧 生 代 空间 或 调 低 触发 并 发 GC 的 
比率 ， 但 在 JDK5.0+、6.0+ 的 版 本 中 有 可 能 会 由 于 JDK 的 bug29 导 致 
CMS 在 remark 完 毕 后 很 久 才 触发 清除 动作 。 对 于 这 种 状况 ， 可 通过 设 
置 -XX: CMSMaxAbortablePrecleanTime=5 (单位 为 ms) 来 避免 。 

4. 统 计 得 到 的 Minor GC 晋 升 到 旧 生 代 的 平均 大 小 大 于 旧 生 代 的 剩 
余 空 间 

这 是 一 个 较为 复杂 的 触发 情况 ，Hotspot 为 了 避免 由 于 新 生 代 对 象 
晋升 到 旧 生 代 导 致 日 生 代 空间 不 足 的 现象 ， 在 进行 Minor GC 时 ， 做 了 
一 个 判断 ， 如 果 之 前 统计 所 得 到 的 Minor GC 晋 升 到 旧 生 代 的 平均 大 小 
大 于 旧 生 代 的 剩余 空间 ， 那 么 就 直接 触发 Full GC。 

例如 程序 第 一 次 触发 MinorGC 后 ， 有 6MB 的 对 象 晋 升 到 旧 生 代 ， 
那么 当下 一 次 Minor GC 发 生 时 ， 首 先 检 查 旧 生 代 的 剩余 空间 是 否 大 于 
6MB， 如 果 小 于 6MB， 则 执行 Full GC。 当 新 生 代 采用 PSGC 时 ， 方 式 稍 
有 不 同 ，PS GC 是 在 Minor GC 后 也 会 检查 ， 例 如 上 面 的 例子 中 第 一 次 
Minor GC 后 ，PS GC 会 检查 此 时 旧 生 代 的 剩余 空间 是 否 大 于 6MB， 如 
小 于 ， 则 触发 对 旧 生 代 的 回收 。 


除了 以 上 4 种 状况 外 ， 对 于 使 用 RMI 来 进行 RPC 或 管理 的 Sun JDK 
应 用 而 言 ， 默 认 情 况 下 会 一 小 时 执行 一 次 Full GC。 可 通过 在 启动 时 通 
过 -java-Dsun.rmi.dgc.client.gcInterval=3600000 来 设置 Full GC 执行 的 间隔 
时 间或 通过 -XX: +DisableExplicitGC 来 禁止 RMI 调 用 System.gc。 

7.3.1.6 Stop the world 案 例 

垃圾 回收 时 ， 应 用 系统 会 产生 一 定 的 停顿 。 尤 其 在 独占 式 的 垃 专 
回收 器 中 ， 整 个 应 用 程序 会 被 停止 ， 直 到 垃圾 回收 的 完成 。 这 种 现象 
称 为 Stop-the-World。 说 得 通俗 一 点 ，Stop-the-World 意 味 着 JVM 停 止 应 
用 程序 ， 而 去 进行 垃圾 回收 。 当 Stop-the-World 发 生 时 ， 除 了 进行 垃圾 
回收 的 线程 ， 其 他 所 有 线程 都 将 停止 运行 。 被 中 断 的 任务 将 在 GC 任务 
完成 后 恢复 执行 。GC 调 优 往往 意味 着 减少 Stop-the-World 的 时 间 。 注 
意 ，Stop-the-World 会 在 任何 一 种 GC 算 法 中 发 生 。 

代码 清单 7-6 例 子 说 明 垃 圾 回收 对 应 用 程序 产生 的 影响 。 模 拟 当 生 
产 环境 系 统 出 现 严重 性 能 问题 ， 即 尝试 重 现 了 Stop-the-World 现 象 。 


代码 清单 7-6 Stop-the-World 示例 


import java.util.HashMap; 


public class StopWorldDemo { 
public static class MyThread extends Thread{ 
HashMap map = new HashMap(); 
public void run() { 
try{ 


while (true) { 


if (map.size()*512/1024/1024»-400) ( 
map.clear();//BuEW EAR Hi 
System.out.println("clean map"); 
) 
byte[] b1; 
for(int i=0;i<100;i++){ 
bl = new byte[512];// 模 拟 内 存 占用 
map.put (System.nanoTime(),b1); 
) 
) 
)catch(Exception ex) { 
ex.printStackTrace(); 
) 
} 
} 


public static class PrintThread extends Thread{ 


public final long starttime = System.currentTimeMillis(); 


public void run() { 
try{ 
while (true) { 
// 每 毫秒 打印 时 间 信息 
long t = System.currentTimeMillis ()-starttime; 
System.out.println(t/1000*"."4t$1000); 
Thread.sleep (1000); 
) 
}catch (Exception ex) { 
ex.printStackTrace(); 
) 
) 


public static void main(String[] args) { 
MyThread t = new MyThread(); 
PrintThread p = new PrintThread(); 
t.start(); 
p.start(); 


上 述 代码 中 定义 了 两 个 线程 ， 分 别 是 MyThread 和 PrintThread 。 
MyThread 不 停 地 申请 系统 内 存 ， 这 会 迫使 进行 垃圾 回收 ，PrintThread 
则 每 隔 0.1s 打 印 出 系统 启动 时 间 。 正 常情 况 下 应 该 Is 有 10 个 输出 。 

使 用 参数 -Xmx512M-Xms512M-XX : +UseSerialGC-Xloggc : 
gclog-XX: +PrintGCDetails， 输 出 如 清单 7-7 所 示 。 


代码 清单 7-7 Stop-the-World 示例 运行 输出 

0.0 

1.14 

clean map 

2;29 

3:309 

clean map 

4.324 

clean map 

5.807 

clean map 

6.978 
clean map 
7,993 
clean map 
9.8 
clean map 
10.148 
114027 
clean map 
12,785 


clean map 


GC 输出 如 清单 7-8 所 示 。 


代码 清单 7-8 Stop-the-World 示例 的 GC 输出 

0.366: [GC 0.366: [DefNew: 139776K-517472K(157248K), 0.2675607 secs] 
139776K->127626K (506816K), 0.2677332 secs] [Times: user-0.19 sys=0.08, real=0.26 secs] 

0.788: [GC 0.788: [DefNew: 157248K-517471K(157248K), 0.3404208 secs] 
267402K->261455K (506816K), 0.3405538 secs] [Times: user=0.31 sys=0.03, real=0.34 secs] 

1.241: [GC 1.241: [DefNew: 157247K-5157247K(157248K), 0.0000146 secs]1.241: 
[Tenured: 243983K->349567K (349568K) , 0.4988513 secs] 401231K->393834K (506816K), [Perm : 
380K->380K (12288K)], 0.4990866 secs] [Times: user=0.50 sys-0.00, real=0.50 secs] 

1.940: [Full GC 1.940: [Tenured: 349567K->47656K (349568K), 0.1760066 secs] 
506815K->47656K (506816K), [Perm : 380K->380K(12288K)], 0.1761751 secs] [Times: 
user-0.17 sys-0.00, real-0.17 secs] 

2.226: [GC 2.227: [DefNew: 139776K->17472K (157248K), 0.2130968 secs] 
187432K->185248K (506816K), 0.2132255 secs] [Times: user-0.22 sys=0.00, real=0.22 secs] 

2.555: [GC 2.555: [DefNew: 157248K-517471K(157248K), 0.2630955 secs] 
325024K->323914K (506816K) , 0.2632084 secs] [Times: user-0.27 sys=0.00, real=0.27 secs] 

2.922: [GC 2.922: [DefNew: 157247K-5157247K (157248K), 0.0000138 secs]2.922: 
[Tenured: 306443K->349567K (349568K) , 0.5437268 secs] 463690K->455014K (506816K), [Perm : 
380K->380K (12288K)], 0.5439029 secs] [Times: user=0.53 sys-0.00, real=0.53 secs] 

3.556: [Full GC 3.556: [Tenured: 349567K-551995K(349568K), 0.1789923 secs] 
506815K->51995K (506816K), [Perm : 380K->379K(12288K)], 0.1791206 secs] [Times: 
user=0.19 sys=0.00, real=0.19 secs] 

3.845: [GC 3.845: [DefNew: 139776K->17471K(157248K), 0.2132299 secs] 
191771K->190545K (506816K), 0.2133538 secs] [Times: user=0.20 sys-0.00, real=0.20 secs] 


4.174: [GC 4.174: [DefNew: 157247K->17471K(157248K), 0.2663958 secs] 
330321K->329202K (506816K), 0.2665229 secs] [Times: user-0.27 sys=0.00, real=0.26 secs] 
4.569: [GC 4.569: [DefNew: 157247K-5157247K(157248K), 0.0000158 secs]4.569: 
[Tenured: 311730K->12917K (349568K), 0.1204363 secs] 468978K->12917K(506816K), [Perm : 

379K->379K (12288K)], 0.1206203 secs] [Times: user-0.13 sys-0.00, real-0.13 secs] 
4.798: [GC 4.798: [DefNew: 139776K->17471K(157248K), 0.2108548 secs] 
152693K->151356K (506816K), 0.2109783 secs] [Times: user-0.20 sys=0.00, real-0.20 secs] 
5.122: [GC 5.122: [DefNew: 157247K->17472K(157248K), 0.2431866 secs] 
291132K-2289949K(506816K), 0.2432983 secs] [Times: user-0.25 sys=0.00, real=0.25 secs] 
5.467: [GC 5.467: [DefNew: 157248K-2157248K(157248K), 0.0000134 secs]5.467: 
[Tenured: 272477K->349567K (349568K) , 0.4970060 secs] 429725K->420767K (506816K), [Perm : 
379K-»379K(12288K)], 0.4971599 secs] [Times: user-0.48 sys-0.00, real-0.48 secs] 
6.058: [Full GC 6.058: [Tenured: 349567K->41509K (349568K), 0.1328209 secs] 
506815K->41509K(506B816K), [Perm : 379K->379K(12288K)], 0.1329192 secs] [Times: 
user-0.14 sys=0.00, real-0.14 secs] 
6.274: [GC 6.274: [DefNew: 139776K->17472K(157248K), 0.1368488 secs] 
181285K->154007K (506816K), 0.1369451 secs] [Times: user-0.14 sys-0.00, real=0.14 secs] 
6.495: [GC 6.495: [DefNew: 157248K->17471K(157248K), 0.1743854 secs] 
293783K->268532K (506816K), 0.1744881 secs] [Times: user-0.19 sys=0.00, real-0.19 secs] 
6.760: [GC 6.760: [DefNew: 157247K->157247K(157248K), 0.0000126 secs]6.760: 
[Tenured: 251060K->349567K (349568K) , 0.3610367 secs] 408308K-2388050K(506816K), [Perm: 
379K->379K (12288K)], 0.3611760 secs] [Times: user=0.37 sys=0.00, real=0.37 secs] 
7.227: [Full GC 7.227: [Tenured: 349567K->33158K(349568K), 0.1144929 secs] 
506815K-»33158K(506816K), [Perm : 379K->379K(12288K)), 0.1145849 secs] [Times: 
user=0.13 sys-0.00, real-0.13 secs] 
7.414: [GC 7.414: [DefNew: 139776K-»217471K(157248K), 0.1112127 secs] 
172934K->132730K (506816K), 0.1113000 secs] [Times: user-0.11 sys-0.00, real=0.11 secs] 
7.599: [GC 7.599: [DefNew: 157247K->17472K(157248K), 0.1426927 secs] 
272506K->234470K (S06816K), 0.1427827 secs] [Times: user-0.14 sys-0.00, real-0.14 secs] 
7.823: [GC 7.823: [DefNew: 157248K-»157248K(15724BK), 0.0000107 secs]7.823: 
[Tenured: 216998K->340621K (349568K), 0.3163073 secs] 374246K-»340621K(506816K), [Perm : 
379K-»379K(12288K)], 0.3164363 secs] [Times: user-0.31 sys-0.00, real-0.31 secs] 
8.217: [GC 8.217: [DefNew: 139776K->139776K (157248K), 0.0000111 secs]8.217: 
[Tenured: 340621K->349567K (349568K) , 0.3631919 secs] 480397K->440326K (506816K), [Perm -+ 
379K-»2379K(12288K)], 0.3633182 secs] [Times: user-0.36 sys-0.00, real-0.36 secs] 
8.643: [Full GC 8.643: [Tenured: 349567K->37244K(349568K), 0.1115731 secs] 
506815K-»537244K(506816K), [Perm : 379K-5379K(12288K)], 0.1116607 secs] [Times: 
user-0.11 sys-0.00, real-0.11 secs] 
8.821: [GC 8.821: [DefNew: 139776K->17472K (157248K), 0.0952736 secs] 
177020K->127601K (506816K), 0.0953525 secs] [Times: user-0.11 sys-0.00, real=0.11 secs] 
8.983: [GC 8.983: [DefNew: 157248K-517471K(157248K), 0.1197464 secs] 
267377K->219190K (506816K), 0.1198281 secs] [Times: user-0.11 sys=0.00, real-0.11 secs] 
9.171: [GC 9.171: [DefNew: 157247K->17472K (157248K), 0.1685964 secs] 
358966K->312990K (506816K), 0.1686990 secs] [Times: user-0.17 sys-0.00, real-0.17 secs] 
9.467: [GC 9.467: [DefNew: 157248K-5157248K(15724BK), 0.0000150 secs]9.467: 
[Tenured: 295518K->349567K (349568K) , 0.5542238 secs] 452766K->452375K (506816K), [Perm: 
379K->379K(12288K)], 0.5544066 secs] [Times: user=0.55 sys=0.00, real=0.55 secs] 
10.113: [Full GC 10.114: [Tenured: 349567K->52002K (349568K), 0.1808479 secs] 


506815K->52002K(506816K), [Perm : 379K->379K(12288K)], 0.1809750 secs] [Times: 
user=0.19 sys=0.00, real=0.19 secs] 

10.407: [GC 10.407: [DefNew: 139776K->17472K(157248K), 0.2176954 secs] 
191778K->190499K (506816K), 0.2178194 secs] [Times: user=0.22 sys=0.00, real-0.22 secs] 

10.740: [GC 10.740: [DefNew: 157248K->17471K(157248K), 0.2684413 secs] 
330275K->329159K (506816K), 0.2685582 secs] [Times: user=0.28 sys=0.00, real=0.28 secs] 

11.122: [GC 11.122: [DefNew: 157247K-5157247K(157248K), 0.0000134 secs]11.122: 
[Tenured: 311687K->349567K (349568K) , 0.5415732 secs] 468935K->462097K (506816K), [Perm: 
379K->379K (12288K) ], 0.5417346 secs] [Times: user=0.50 sys-0.00, real=0.55 secs] 

11.757: [Full GC 11.757: [Tenured: 349567K->48817K (349568K), 0.1491027 secs] 
506815K->48817K(506816K), [Perm : 379K->379K(12288K)], 0.1492014 secs] [Times: 
user=0.16 sys=0.00, real=0.16 secs] 

11.990: [GC 11.990: [DefNew: 139776K->17472K(157248K), 0.1398503 secs] 
188593K->162017K (506816K), 0.1399383 secs] [Times: user=0.14 sys=0.00, real-0.14 secs] 

12.253: [GC 12.253: [DefNew: 157248K->17471K(157248K), 0.2044428 secs] 
301793K->293736K (506816K), 0.2045332 secs] [Times: user-0.20 sys=0.00, real-0.20 secs] 

12.539: [GC 12.539: [DefNew: 157247K-5157247K(157248K), 0.0000114 secs]12.539: 
[Tenured: 276264K->349567K (349568K) , 0.3627016 secs] 433512K->403701K (506816K), [Perm : 
379K->379K (12288K)], 0.3628280 secs] [Times: user=0.36 sys-0.00, real=0.36 secs] 

12.986: [Full GC 12.986: [Tenured: 349567K->27685K (349568K), 0.1033825 secs] 
506815K->27685K (506816K), [Perm : 379K->379K(12288K)], 0.1034725 secs] [Times: 
user-0.11 sys-0.00, real-0.11 secs] 

13.154: [GC 13.154: [DefNew: 139776K->17472K(157248K), 0.0961716 secs] 
167461K->116529K (506816K), 0.0962454 secs] 


可 以 看 到 1.14s 到 2.9s 直 接 出 现 了 一 次 Full GC， 持 续 时 间 0.17s， 以 
及 两 个 minor gc， 这 些 gc 严重 干扰 了 PrintThread 的 正常 工作 。 

当 通 过 Stop-the-world 机 制 的 方式 来 运行 垃圾 收集 器 时 ， 垃 圾 收集 
器 会 在 内 存 回 收 的 过 程 中 暂停 程序 中 所 有 的 工作 线程 ， 直 至 完成 内 存 
回收 才 会 恢复 之 前 被 暂停 的 工作 线程 。 如 果 Stop-the-world 出 现在 新 生 
代 的 Minor GC 中 时 ， 由 于 新 生 代 的 内 存 空间 通常 都 比较 小 ， 所 以 暂停 
时 间 也 在 可 接受 的 合理 范围 之 内 ， 不 过 一 旦 出 现在 老年 代 的 Full GC 中 


时 ， 程 序 的 工作 线程 被 暂停 的 时 间 将 会 更 久 ， 这 往往 直接 跟 Java 堆 空间 
所 管理 的 内 存 大 小 有 关 。 简 单 来 说 ， 内 存 空间 越 大 ， 执 行 Full GC 的 时 
间 就 会 越久 ， 相 对 的 工作 线程 被 暂停 的 时 间 也 就 会 更 长 。 以 互联 网 项 
目 为 例 ， 由 于 项 目的 特殊 性 ， 因 此 经 常 需 要 用 到 多 大 几 十 乃至 上 百 GB 
的 内 存 ， 如 果 用 户 的 登录 操作 恰巧 碰见 垃圾 收集 绒 在 执行 Full GCH, 
这 将 会 是 一 场 灾 难 ， 如 果 用 户 等 待 的 时 间 过 长 ， 这 就 不 是 用 尸体 验 下 
降 这 么 简单 的 事情 了 ， 甚 至 有 可 能 会 流失 用 户 ， 所 以 JVM 的 设计 者 们 
提供 了 并 发 回收 希望 以 此 缩短 Stop-the-world 机 制 的 暂停 时 运行 或 交叉 
运行 。 直 到 目前 为 止 ， 哪 怕 是 G1 也 不 能 完全 避免 Stop-the-world 情 况 发 
生 ， 只 能 说 垃圾 回收 器 越 来 越 优秀 ， 回 收效 率 越 来 越 高 ， 尽 可 能 地 缩 
短 了 暂停 时 间 。 


7.3.2 垃圾 回收 算法 


目前 有 两 种 比较 常见 的 垃圾 标记 算法 ， 分别 是 引用 计数 算法 和 根 
搜索 算法 。 引 用 计数 器 在 微软 的 COM 组 件 技术 中 、Adodb 的 
ActionScript3 种 都 有 使 用 。 

7.3.2.1 引用 计数 法 

存 释 引用 计数 活 对 象 ， 哪 放 掉 其 所 占 法 (Referen 些 是 已 经 死 用 的 
内 存 空 ce Counting 亡 的 对 象 ， 只 间 ， 因 此 这 个 ) 在 GC 执行 有 被 标记 为 
过 程 我 们 可 垃圾 回收 之 已 经 死亡 的 对 以 称 之 为 垃圾 前 ， 首 先 需要 象 ， 
GC 才 标记 阶段 。 区 分 出 内 存 会 在 执行 垃圾 中 哪些 是 回收 时 ， 

数 不 引 值 引 用 计数 器 就 加 1， 可 能 再 被 使 用 计数 器 算 操 作 的 同时 器 
的 实现 很 当 引 用 失效 时 用 。 也 就 是 法 的 一 大 优 检 查 计 数 器 简单 ， 对 于 
一 ，3| 用 计数 说 ， 引 用 计数 势 就 是 不 用 等 是 否 为 0， 如 个 对 象 A， 器 就 
减 1。 只 器 的 实现 只 待 内 存 不 够 果 是 的 话 就 只 要 有 任何 一 要 对 象 A 的 需 
要 为 每 个 用 的 时 候 ， 可 以 立即 回收 个 对 象 引 用 引用 计数 器 的 对 象 配置 
一 个 才 进 行 垃圾 的 。 了 A， 则 A 值 为 0， 则 整形 的 计数 回收 ， 完 全 的 5 
用 计 对 象 A 就 器 即 可 。 可 以 在 赋 

首 时 B 器 但 是 引用 述 如 下 : 有 ， 对 象 A 和 。 也 就 是 说 无 法 识别 ， 计 
数 器 有 一 对 象 A 和 对 对 象 B 的 引 ，A 和 B 是 引起 内 存 泄 个 严重 的 问题 象 
B， 对 象 用 计数 器 都 不 应 该 被 回收 的 漏 。， 即 无 法 处 A 中 含有 对 象 为 
0。 但 是 垃圾 对 象 ， 理 循环 引用 B 的 引用 ， 在 系统 中 却 不 但 由 于 垃圾 的 


情况 。 一 个 对 象 B 中 含 存 在 任何 第 对 象 间 相 互 引 简单 的 循环 有 对 象 A 的 
3 个 对 象 引 用 ， 从 而 使 引用 问题 引用 。 此 用 了 A 或 垃圾 回收 

引 的 回 如 图 7-2 用 第 一 个 元 各 个 元 素 的 收 ! 所 示 ， 我 们 构 素 ， 从 而 
构 计 数 器 都 不 造 了 一 个 列 成 循环 引用 ， 为 0， 同 时 我 表 ， 我 们 将 这 个 时 
候 如 们 也 失去 了 最 后 一 个 元 素 果 我 们 将 列表 对 列表 的 引 的 next 属 性 的 头 
head 赋 用 控制 ， 从 而 指向 第 一 个 值 为 null， 导 致 列表 元 元 素 ， 即 此 时 列 
表 素 不 能 被 


head ListElenent p- ListElement ListElenent™ 


head ListElement ~ ListElenent ListKlement x 
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(b) 
图 7-2 引用 计数 流程 图 

的 数 用 引用 计数 开销 。 其 次 器 为 0， 就 的 问题 。 正 器 拥有 一 些 每 次 
赋值 都 可 作为 垃圾 是 由 于 最 后 特性 ， 首 先 它 需要 更 新 计数 回收 。 接 下 
来 一 条 致命 缺陷 需要 单独 的 器 ， 这 增加 它 方便 及 时 ， 导 致 在 Ja 字段 存储 
计 了 时 间 开 销 回收 垃圾 ，va 的 垃圾 回 数 器 ， 这 样 的。 再 者 垃圾 对 没有 
延迟 性 。 收 器 中 没有 使 做 法 增加 了 象 便 于 辨识 最 后 不 能 解 用 这 类 算法 
存储 空间 ， 只 要 计 决 循环 引 。 

7.3.2.2 根 搜索 算法 

数 垃 当 数 HotSpot 算 法 尽管 实 圾 标记 的 准 目标 对 象 被 器 中 的 值 为 和 
大 部 分 JV 现 简单 ， 执 确 性 。 由 于 其 他 存活 对 0 的 时 候 ， 就 M 中 是 使 用 根 
行 效率 也 不 错 引 用 计数 算法 象 引 用 时 ， 引 意味 着 该 对 搜索 算法 作 ， 但 
是 该 算 会 为 程序 中 用 计数 器 中 象 已 经 不 再 被 为 垃圾 标记 法 本 身 却 存 的 
每 一 个 对 的 值 则 会 加 任何 存活 对 的 算法 实现 。 在 一 个 较 大 的 象 都 创建 
一 个 1， 不 再 引用 象 引 用 ， 可 以 前 面 介 绍 过 浆 端 ， 甚 至 私有 的 引用 时 便 


会 减 1， 被 标记 为 垃 的 引用 计 会 影响 到 计数 器 ， 当 引用 计 圾 对 象 。 采 用 
这 种 方式 看 起 来 似乎 没有 任何 问题 ， 但 是 如 果 一 些 明 显 已 经 死亡 了 的 
对 象 尽 管 没有 被 任何 的 存活 对 象 引 用 ， 但 是 它们 彼此 之 间 却 存在 相互 
引用 时 ， 引 用 计数 器 中 的 值 则 永远 不 会 为 0， 这样 便 会 导致 GC 在 执行 
内 存 回 收 时 永远 无 法 释放 掉 无 用 对 象 所 占用 的 内 存 空间 ， 极 有 可 能 引 
发 内 存 泄露 。 

相对 于 引用 计数 算法 而 言 ， 根 搜索 算法 不 仅 同 样 具 备 实现 简单 和 
执行 高 效 等 特点 ， 更 重要 的 是 该 算法 可 以 有 效 地 解决 在 引用 计数 算法 
中 一 些 已 经 死亡 的 对 象 因 相互 引用 而 导致 的 无 法 正确 被 标记 的 问题 ， 
防止 内 存 泄 露 的 发 生 。 简 单 来 说 ， 根 搜索 算法 是 以 根 对 象 集合 作为 起 
始点 ， 按 照 从 上 至 下 的 方式 搜索 被 根 对 象 集合 所 连接 的 目标 对 象 是 否 
可 达 〈 使 用 根 搜索 算法 后 ， 内 存 中 的 存活 对 象 都 会 被 根 对 象 集合 直接 
或 间接 连接 着 ) ， 如 果 目 标 对 象 不 可 达 时 ， 就 意味 着 该 对 象 已 经 死 
È, {Œp LEA f£instanceOopDesc[4] BY Mark World 中 将 其 标记 为 垃圾 对 
象 。 在 根 搜 索 算 法 中 ， 只 有 能 够 被 根 对象 集 合 直接 或 者 间接 连接 的 对 
象 才 是 存活 对 象 。 在 HotSpot 中 ， 根 对 象 集合 中 包含 了 5 个 元 素 ，Java 栈 
中 的 对 象 引 用 、 本 地 方法 栈 中 的 对 象 引 用 、 运 行 时 常量 池 中 的 对 象 引 
用 、 方 法 区 中 类 静态 属性 的 对 象 引 用 以 及 与 一 个 类 对 应 的 唯一 数据 类 
型 的 Class 对 象 。 

注意 ， 在 根 搜索 算法 中 不 可 达 的 对 象 ， 也 并 非 是 “ 非 死 不 可 ”的 ， 
这 时 候 它 们 暂时 处 于 “缓刑 ?阶段 ， 要 真正 宣告 一 个 对 象 死亡 ， 至 少 要 
经 历 两 次 标记 过 程 : 如 果 对 象 在 进行 根 搜索 后 发 现 没 有 与 GC Roots 相 
连接 的 引用 链 ， 那 它 将 会 被 第 一 次 标记 并 且 进 行 一 次 得 选 ， 筛 选 的 条 
件 是 此 对 象 是 否 有 必要 执行 finalize 0 方法 。 当 对 象 没有 覆盖 finalize 
() 方法 ， 或 者 finalize () 方法 已 经 被 虚拟 机 调用 过 ， 虚 拟 机 将 这 两 
种 情况 都 视 为 “没有 必要 执行 ?>。 如 果 这 个 对 象 被 判定 为 有 必要 执行 
finalize () 方法 ， 那 么 这 个 对 象 将 会 被 放置 在 一 个 名 为 F-Queue 的 队列 
之 中 ， 并 在 稍 后 由 一 条 由 虚拟 机 自动 建立 的 、 低 优先 级 的 Finalizer 线 程 
去 执行 。 这 里 所 谓 的 “执行 * 是 指 虚 拟 机 会 触发 这 个 方法 ， 但 并 不 承诺 
会 等 待 它 运 行 结 束 。 这 样 做 的 原因 是 ， 如 果 一 个 对 象 在 finalize () A 
法 中 执行 缓慢 ， 或 者 发 生 了 死 循环 (更 极端 的 情况 ) ， 将 很 可 能 会 导 
致 F-Queue 队 列 中 的 其 他 对 象 永久 处 于 等 待 状 态 ， 甚 至 导致 整个 内 存 回 
收 系统 骨 溃 。finalize () 方法 是 对 象 逃 脱 死 亡命 运 的 最 后 一 次 机 会 ， 


稍 后 GC 将 对 F-Queue 中 的 对 象 进 行 第 二 次 小 规模 的 标记 ， 如 果 对 象 要 
在 finalize () 中 成 功 拯救 自己 一 只 要 重新 与 引用 链 上 的 任何 一 个 对 象 
建立 关联 即 可 ， 璧 如 把 自己 《this 关键 字 ) 赋值 给 某 个 类 变量 或 对 象 的 
成 员 变 量 ， 那 在 第 二 次 标记 时 它 将 被 移 除 出 “即将 回收 ”的 集合 ;如 果 
对 象 这 时 候 还 没有 逃脱 ， 那 它 就 真 的 离 死 不 远 了 。 从 代码 清单 7-9 中 我 
们 可 以 看 到 一 个 对 象 的 finalize () 被 执行 ， 但 是 它 仍然 可 以 存活 。 
代码 清单 7-9 逃脱 回收 实验 
public class FinalizeEscapeGC { 
public static FinalizeEscapeGC SAVE HOOK - null; 
public void isAlive() { 
System.out.println("yes, i am still alive"); 


) 


QOverride 


protected void finalize() throws Throwable { 


super.finalize(); 
System.out.println("finalize mehtod executed!"); 
FinalizeEscapeGC.SAVE HOOK - this; 


public static void main(String[] args) throws Throwable { 
SAVE HOOK = new FinalizeEscapeGC() ; 
// 对 象 第 一 次 成 功 拯救 自己 
SAVE HOOK = null; 
System.gc() ; 
// 因为 Finalizer 方 法 优先 级 很 低 ， 暂 停 0 ,5 秒 ， 以 等 待 它 
Thread,Sleep(500) ; 
if (SAVE HOOK != null) { 
SAVE HOOK. isAlive(); 
else | 


System.out.println("no, i am dead"); 


// 下 面 这 段 代 码 与 上 面 的 完全 相同 ， 但 是 这 次 自救 却 失 败 了 
SAVE HOOK = null; 
System.gc() ; 
// 因为 Finalizer 方法 优先 级 很 低 ， 暂 停 0 .5 秒 ， 以 等 待 它 
Thread.sleep (500) ; 
if (SAVE HOOK != null) { 
SAVE HOOK.isAlive() ; 
else { 


System.out.println("no, i am dead"); 


} 


输出 如 清单 7-10 所 示 。 


代码 清单 7-10 过 脱 回收 实验 运行 输出 
finalize mehtod executed! 
yes, i am still alive 


no, i am dead 


从 代码 清单 7-10 的 运行 结果 可 以 看 到 ，SAVE_HOOK 对 象 的 finalize 
0 方法 确实 被 GC 收 集 器 触发 过 ， 并 且 在 被 收集 前 成 功 逃 脱 了 。 另 外 
一 个 值得 注意 的 地 方 就 是 ， 代 码 中 有 两 段 完全 一 样 的 代码 片段 ， 执 行 
结果 却 是 一 次 逃脱 成 功 ， 一 次 失败 ， 这 是 因为 任何 一 个 对 象 的 finalize 
() 方法 都 只 会 被 系统 自动 调用 一 次 ， 如 果 对 象 面 临 下 一 次 回收 ， 它 
的 finalize () 方法 不 会 被 再 次 执行 ， 因 此 第 二 段 代码 的 自救 行动 失败 
Ta 

7.3.2.3 标记 一 清除 算法 (Mark-Sweep) 

当成 功 区 分 出 内 存 中 存活 对 象 和 死亡 对 象 后 ，GC 接 下 来 的 任务 就 
是 执行 垃圾 回收 释放 掉 无 用 对 象 所 占用 的 内 存 空 间 ， 以 便 有 足够 的 可 
用 内 存 空间 为 新 对 象 分 配 内 存 。 目 前 在 JVM 中 比较 常见 的 三 种 垃圾 收 
集 算法 是 标记 -清除 算法 (Mark-Sweep) 、 复 制 算法 (Copying) 、 标 
记 一 压缩 算法 (Mark-Compact) 。 在 介绍 三 种 算法 之 前 ， 我 们 先 来 通 
过 表 7-1 看 看 它们 之 间 的 区 别 。 

表 7-1 算法 比较 表 


|. [makswep — makcmpad | copying ooo | 
Ps 
通常 需要 活 对 象 的 2 倍 大 小 
(不 堆积 碎片 ) 


空间 开销 少 〈 但 会 推 积 碎片 ) 少 (不 堆积 碎片 ) 


pat 


标记 -清除 算法 (Mark-Sweep) 是 一 种 非常 基础 和 常见 的 垃圾 收集 
算法 ， 该 算法 被 JJMcCarthy 等 人 在 1960 年 提出 并 成 功 地 发 明 并 应 用 于 
Lisp 语 言 。 我 们 以 餐巾 纸 作为 示例 ， 午 餐 过 程 中 ， 和 餐厅 里 的 所 有 人 都 根 
据 自己 的 需要 取 用 餐巾纸。 当 垃 圾 收集 机 器 人 想 收集 废旧 餐巾纸 的 时 
候 ， 它 会 让 所 有 用 和 餐 的 人 先 停 下 来 ， 然 后 ， 依 次 询问 餐厅 里 的 每 一 个 


人 :“ 你 正在 用 和 餐巾纸 吗 ? 你 用 的 是 哪 一 张 餐 巾 纸 ? * 机 器 人 根据 每 个 
人 的 回答 将 人 们 正在 使 用 的 餐巾 纸 画 上 记号 。 询 问 过 程 结 束 后 ， 机 器 
人 在 餐厅 里 寻找 所 有 散落 在 餐桌 上 且 没 有 记号 的 餐巾 纸 (这 些 显然 都 
是 用 过 的 废旧 餐巾 纸 ) ， 把 它们 统统 扔 到 垃圾 箱 里 。 

回 到 算法 本 身 。 算 法 涉及 几 个 概念 ， 我 们 先 来 了 解 一 下 mutator 和 
collector， 这 两 个 名 词 经 常 在 垃圾 收集 算法 中 出 现 ，collector 指 的 就 是 
垃圾 收集 器 ， 而 mutator 是 指 除 了 垃圾 收集 器 之 外 的 部 分 ， 比 如 说 我 们 
应 用 程序 本 身 。mnutator 的 职责 一 般 是 NEW (分 配 内 存 ) , READ (从 
内 存 中 读 取 内 容 ) , WRITE (将 内 容 写 入 内 存 ) ， 而 collector 则 就 是 回 
收 不 再 使 用 的 内 存 来 供 mutator 进 行 NEW 操 作 的 使 用 。mutator 根 对 象 一 
般 指 的 是 分 配 在 堆 内 存 之 外 ， 可 以 直接 被 mutator 直 接 访 问 到 的 对 象 ， 
一 般 是 指 静 态 /全 局 变量 以 及 Thread-Local 变 量 [5]。 

标记 -清除 算法 将 垃圾 回收 分 为 两 个 阶段 ， 标 记 阶 段 和 清除 阶段 。 
在 标记 阶段 ，collector 从 mnutator 根 对 象 开始 进行 遍历 ， 对 从 mnutator 根 对 
象 可 以 访问 到 的 对 象 都 打上 一 个 标识 ， 一 般 是 在 对 象 的 header 中 ， 将 其 
记录 为 可 达 对 象 。 而 在 清除 阶段 ，collector 对 堆 内 存 (heap memory) 
从 头 到 尾 进 行 线性 的 人 遍历， 如果 发 现 某 个 对 象 没 有 标记 为 可 达 对 象 ， 
通过 读 取 对 象 的 header 信 息 ， 则 就 将 其 回收 。 一 种 可 行 的 实现 是 ， 在 标 
记 阶 段 首先 通过 根 节点 ， 标 记 所 有 从 根 节点 开始 的 各 大 对 象 。 因 此 ， 
未 被 标记 的 对 象 就 是 未 被 引用 的 垃圾 对 象 。 然 后 ， 在 清除 阶段 ， 清 除 
所 有 未 被 标记 的 对 象 。 

前 面 说 过 ， 标 记 - 清 除 算法 的 执行 过 程 分 为 “标记 ”和 “清除 ”两 大 阶 
段 。 这 种 分 步 执行 的 思路 奠定 了 现代 垃圾 收集 算法 的 思想 基础 。 与 引 
用 计数 算法 不 同 的 是 ， 标 记 - 清 除 算 法 不 需要 运行 环境 监测 每 一 次 内 存 
分 配 和 指针 操作 ， 而 只 要 在 “标记 ”阶段 中 跟踪 每 一 个 指针 变量 的 指 
向 ， 用 类 似 思 路 实现 的 垃圾 收集 器 也 常 被 后 人 统称 为 跟踪 收集 器 

(Tracing Collector) 。 

标记 -清除 算法 最 大 的 问题 是 存在 大 量 的 空间 碎片 ， 因 为 回收 后 的 
空间 是 不 连续 的 。 在 对 象 的 堆 空 间 分 配 过 程 中 ， 尤 其 是 大 对 象 的 内 存 
分 配 ， 不 连续 的 内 存 空间 的 工作 效率 要 低 于 连续 的 空间 ]。 

相对 于 另外 两 种 内 存 回 收 算法 而 言 ， 标 记 - 清 除 算法 (Mark- 
Sweep) 不 仅 执行 效率 低下 ， 更 重要 的 是 ， 由 于 被 执行 内 存 回收 的 无 用 


对 象 所 占用 的 内 存 空间 有 可 能 是 一 些 不 连续 的 内 存 块 ， 不 可 避免 地 会 
产生 一 些 内 存 碎 片 ， 从 而 导致 后 续 没 有 足够 的 可 用 内 存 空间 分 配给 较 
大 的 对 象 。 

7.3.2.4 复制 算法 (Copying) 

为 了 解决 标记 -清除 算法 在 垃圾 收集 效率 方面 的 缺陷 ，M.L.Minsky 
于 1963 年 发 表 了 著名 的 论文 “一 种 使 用 双 存 储 区 的 Lisp 语 言 垃圾 收集 器 
(A LISP Garbage Collector Algorithm Using Serial Secondary 
Storage) ”。M.L.Minsky 在 该 论文 中 描述 的 算法 被 人 们 称 为 复制 算法 ， 
它 也 被 M.L.Minsky 本 人 成 功 地 引入 到 了 Lisp 语 言 的 一 个 实现 版 本 中 。 标 
记 - 清 除 算法 后 来 被 引入 JVM 中 ， 提 升 了 GC 在 垃圾 标记 和 内 存 释放 这 两 
个 阶段 的 执行 效率 。 还 是 采用 之 前 的 餐厅 示例 ， 餐 厅 被 垃圾 收集 机 器 
人 分 成 南 区 和 北 区 两 个 大 小 完全 相同 的 部 分 。 午 餐 时 ， 所 有 人 都 先 在 
AKAZ 〈 因 为 空间 有 限 ， 用 和 餐 人 数 自然 也 将 减少 一 半 ) ， 用 和 餐 时 可 
以 随意 使 用 和 餐巾纸 。 当 垃圾 收集 机 器 人 认为 有 必要 回收 废旧 和 餐巾纸 
时 ， 它 会 要 求 所 有 用 和 餐 者 以 最 快 的 速度 从 南 区 转移 到 北 区 ， 同 时 随身 
携带 自己 正在 使 用 的 餐巾 纸 。 等 所 有 人 都 转移 到 北 区 之 后 ， 垃 圾 收集 
机 器 人 只 要 简单 地 把 南 区 中 所 有 散落 的 餐巾 纸 扔 进 垃圾 箱 就 算 完成 任 
务 了 。 下 一 次 垃圾 收集 的 工作 过 程 也 大 臻 类似， 唯一 的 不 同 只 是 人 们 
的 转移 方向 变 成 了 从 北 区 到 南 区 。 如 此 循环 往复 ， 每 次 垃圾 收集 都 只 
需 简 单 地 转移 (也 就 是 复制 ) 一次， 垃圾 收集 速度 无 与 伦比 一 当然 ， 
对 于 用 和 餐 者 往返 奔波 于 南北 两 区 之 间 的 平 劳 ， 垃 圾 收集 机 器 人 是 决 不 
ZEE £g BB. 

回 到 算法 本 身 。 复 制 算法 首先 将 活着 的 内 存 空 间 分 为 两 块 ， 每 次 
只 使 用 其 中 一 块 ， 在 垃圾 回收 时 将 正在 使 用 的 内 存 中 的 存活 对 象 复制 
到 未 被 使 用 的 内 存 块 中 ， 之 后 清除 正在 使 用 的 内 存 块 中 的 所 有 对 象 ， 
交换 两 个 内 存 的 角色 ， 最 后 完成 垃圾 回收 。 

如 果 系统 中 的 垃圾 对 象 很 多 ， 复 制 算法 需要 复制 的 存活 对 象 数量 
并 不 会 太 大 。 因 此 在 真正 需要 垃圾 回收 的 时 刻 ， 复 制 算 法 的 效率 是 很 
高 的 。 又 由 于 对 象 在 垃圾 回收 过 程 中 统一 被 复制 到 新 的 内 存 空 间 中 ， 
因此 ， 可 确保 回收 后 的 内 存 空间 是 没有 碎片 的 。 该 算法 的 缺点 是 将 系 
统 内 存折 半 。 


Java 的 年 轻 代 串 行 垃圾 回收 器 中 使 用 了 复制 算法 的 思想 。 年 轻 代 分 
为 eden 空 间 、from 空 间 、to 空 间 3 个 部 分 。 其 中 from 空 间 和 to 空间 可 以 视 
为 用 于 复制 的 两 块 大 小 相同 、 地 位 相等 ， 且 可 进行 角色 互 换 的 空间 
块 。from 和 to 空间 也 称 为 survivor 空 间 ， 即 六 存 者 空间 ， 用 于 存放 未 被 
回收 的 对 象 。 

在 垃圾 回收 时 ，eden 空 间 中 的 存活 对 象 会 被 复制 到 未 使 用 的 
survivor 空 间 中 (假设 是 to) ， 正 在 使 用 的 survivor 空 间 (假设 是 from) 
中 的 年 轻 对 象 也 会 被 复制 到 to 空间 中 (大 对 象 ， 或 者 老年 对 象 会 直接 进 
入 老年 带 ， 如 果 to 空 间 已 满 ， 则 对 象 也 会 直接 进入 年 老 代 ) 。 此 时 ， 
eden 空 间 和 from 空 间 中 的 剩余 对 象 就 是 垃圾 对 象 ， 可 以 直接 清空 oF 
间 则 存放 此 次 回收 后 的 存活 对 象 。 这 种 改进 的 复制 算法 既 保证 了 空间 
的 连续 性 ， 又 避免 了 大 量 的 内 存 空间 浪费 。 

基于 分 代 的 概念 ，Java 扒 区 如 果 还 要 更 进一步 细 分 的 话 ， 还 可 以 划 
分 为 新 生 代 (YoungGen) 和 老年 代 (OldGen) ， 其 中 新 生 代 又 可 以 被 
划分 为 Eden 空 间 、From Survivor 空 间 和 To Survivor 空 间 。 在 HotSpot 
中 ，Eden 空 间 和 另外 两 个 Survivor 空 间 默 认 所 占 的 比例 是 8: 1， 当 然 开 
发 人 员 可 以 通过 选项 “-XX: SurvivorRatio” 调 整 这 个 空间 比例 。 当 执行 
一 次 Minor GC (新 生 代 的 垃圾 回收 ) 时 ，Eden 空 间 中 的 存活 对 象 会 被 
复制 到 To 空间 内 ， 并 且 之 前 已 经 经 历 过 一 次 Minor GC 并 在 From 空 间 中 
存活 下 来 的 对 象 如 果 还 年 轻 的 话 同样 也 会 被 复制 到 To 空间 内 。 需 要 注 
意 的 是 ， 在 满足 两 种 特殊 情况 下 ，Eden 和 From 空 间 中 的 存活 对 象 将 不 
会 被 复制 到 To 空间 内 。 首 先是 如 果 存 活 对 象 的 分 代 年 龄 超过 选项 “- 
XX: MaxTenuringThreshold” 所 指定 的 阅 值 时 ， 将 会 直接 普 升 到 老年 代 
rH; 其 次 当 To 空 间 的 容量 达到 疝 值 时 ， 存 活 对 象 同样 也 是 直接 晋升 到 
老年 代 中 。 当 所 有 的 存活 对 象 都 被 复制 到 To 空间 或 者 晋升 到 老年 代 
后 ， 剩 下 的 均 为 垃圾 对 象 ， 这 就 意味 着 GC 可 以 对 这 些 已 经 死亡 了 的 对 
象 执行 一 次 Minor GC， 释 放 掉 其 所 占用 的 内 存 空间 。 

当 执 行 完 Minor GC 之 后 ，Eden 空 间 和 From 空 间 将 会 被 清空 ， 而 存 
活 下 来 的 对 象 则 会 被 全 部 存储 在 To 空间 内 ， 接 下 来 From 空 间 和 To 空间 
将 会 互 换 位置 。 其 实 复制 算法 无 非 就 是 使 用 To Survivor 空 间作 为 一 个 临 
时 的 空间 交换 角色 ， 务 必需 要 保证 两 块 Survivor 空 间 中 一 块 必 须 是 空 
的 ， 这 就 是 复制 算法 。 尽 管 复制 算法 能 够 高 效 执行 Minor GC, ee 
却 并 不 适用 于 老年 代 中 的 内 存 回收 ， 因 为 老年 代 中 对 象 的 生命 周期 都 


比较 长 ， 甚 至 在 某 些 极端 的 情况 下 还 能 够 与 JVM 的 生命 周期 保持 一 
致 ， 所 以 如 果 老 年 代 也 采用 复制 算法 执行 内 存 回 收 不 仪 需 要 额外 的 时 
间 和 空间 ， 而 且 还 会 导致 较 多 的 复制 操作 影响 到 GC 的 执行 效率 。 

总 的 来 说 ， 由 于 JVM 中 的 绝 大 多 数 对 象 都 是 瞬时 状态 的 ， 生 命 周 
期 非常 短暂 ， 所 以 复制 算法 被 广泛 应 用 于 新 生 代 中 。 人 分区、 复制 的 思 
路 不 仅 大 幅 提 高 了 垃圾 收集 的 效率 ， 而 且 也 将 原本 繁 纷 复杂 的 内 存 分 
配 算法 变 得 前 所 未 有 地 简明 扼要 (既然 每 次 内 存 回 收 都 是 对 整个 半 区 
的 回收 ， 内 存 分 配 时 也 就 不 用 考虑 内 存 碎片 等 复杂 情况 ， 只 要 移动 堆 
顶 指针 ， 按 顺序 分 配 内 存 就 可 以 了 ) ， 这 简直 是 个 奇迹 ! Ti, 任何 
奇迹 的 出 现 都 有 一 定 的 代价 ， 在 垃圾 收集 技术 中 ， 复 制 算 法 提高 效率 
的 代价 是 人 为 地 将 可 用 内 存 缩 小 了 一 半 。 

7.3.2.5 标记 一 压缩 算法 (Mark-Compact) 

标记 一 清除 算法 的 确 可 以 应 用 在 老年 代 中 ， 但 是 该 算法 不 仅 执 行 
效率 低下 ， 而 且 在 执行 完 内 存 回 收 后 还 会 产生 内 存 人 碎片 ， 所 以 JVM 的 
设计 者 们 在 此 基础 之 上 进行 了 改进 ， 标 记 一 压缩 算法 由 此 诞生 。 标 记 - 
整理 算法 是 标记 -清除 算法 和 复制 算法 的 有 机 结合 。 把 标记 -清除 算法 在 
内 存 占用 上 的 优点 和 复制 算法 在 执行 效率 上 的 特长 综合 起 来 ， 这 是 所 
有 人 都 希望 看 到 的 结果 。 不 过 ， 两 种 垃圾 收集 算法 的 整合 并 不 像 1 加 1 
等 于 2 那样 简单 ， 我 们 必须 引入 一 些 全 新 的 思路 。1970 年 前 后 ， 
G.L.Steele，C.J.Chene 和 D.S.Wise 等 研究 者 陆续 找到 了 正确 的 方向 ， 标 
记 - 整 理 算法 的 轮廓 也 逐渐 清晰 了 起 来 。 还 是 采用 之 前 的 餐厅 示例 ， 在 
我 们 熟悉 的 餐厅 里 ， 这 一 次 ， 垃 圾 收集 机 器 人 不 再 把 餐厅 分 成 两 个 两 
北 区 域 了 。 需 要 执行 垃圾 收集 任务 时 ， 机 器 人 先 执行 标记 -清除 算法 的 
第 一 个 步骤 ， 为 所 有 使 用 中 的 餐巾 纸 画 好 标记 ， 然 后 ， 机 器 人 命令 所 
有 就 餐 者 带 上 有 标记 的 餐巾 纸 向 餐厅 的 南面 集中 ， 同 时 把 没有 标记 的 
废旧 和 餐巾纸 扔 向 餐厅 北面 。 这 样 一 来 ， 机 器 人 只 要 站 在 餐厅 北面 ， 怀 
抱 垃圾 箱 ， 迎 接 扑面 而 来 的 废旧 和 餐巾纸 就 行 了 。 

回 到 算法 本 身 。 当 成 功 标 记 出 内 存 中 的 垃圾 对 象 后 ， 标 记 一 压缩 
算法 会 将 所 有 的 存活 对 象 都 移动 到 一 个 规整 且 连 续 的 内 存 空间 中 ， 然 
后 执行 Full GC (老年 代 的 垃圾 回收 ， 或 者 被 称 为 Major GC) 回收 无 用 
对 象 所 占用 的 内 存 空间 。 当 成 功 执 行 压缩 之 后 ， 已 用 和 未 用 的 内 存 都 
各 占 一 边 ， 彼 此 之 间 维 系 着 一 个 记录 下 一 次 分 配 起 始点 的 标记 指针 ， 


当 为 新 对 象 分 配 内 存 时 ， 则 可 以 使 用 指针 碰撞 (Bump the Pointer) 技 
术 修 改 指 针 的 偏 移 量 将 新 对 象 分 配 在 第 一 个 空 闪 内存 位 置 上 ， 为 新 对 
象 分 配 内 人 存 带 来 便捷 。 

在 HotSpot 中 ， 基 于 分 代 的 概念 ，GC 所 使 用 的 内 存 回收 算法 必须 结 
合 新 生 代 和 老年 代 各 自 的 特点 ， 简 单 来 说 ， 就 是 针对 不 同 的 代 空间 ， 
从 而 结合 使 用 不 同 的 垃圾 收集 算法 。 为 新 生 代 选择 的 垃圾 收集 算法 通 
常 是 以 速度 优先 ， 因 为 新 生 代 中 所 存储 的 瞬时 对 象 声 明 周期 非常 短 
暂 ， 可 以 有 针对 性 地 使 用 复制 算法 ， 因 此 执行 Minor GC 时 ， 一 定 要 保 
持 高 效 和 快速 。 而 新 生 代 中 的 生存 空间 通常 都 比较 小 ， 所 以 回收 新 生 
代 时 一 定 会 非常 频繁 。 但 老年 代 通 常 使 用 更 节省 内 存 的 回收 算法 ， 
为 老年 代 中 所 存储 的 对 象 声 明 周 期 都 非常 长 ， 并 且 老 年 代 占 据 了 大 部 
分 的 堆 空间 ， 所 以 老年 代 的 Full GC 并 不 会 跟 新 生 代 的 Minor GC 一 样 频 
繁 ， 不 过 一 旦 程序 中 发 生 一 次 Full GC 时 ， 将 会 耗费 更 长 的 时 间 来 完 
成 ， 那 么 在 老年 代 中 使 用 标记 一 清除 算法 或 者 标记 一 压缩 算法 执行 垃 
圾 回收 将 会 是 不 错 的 选择 。 

复制 算法 的 高 效 性 是 建立 在 存活 对 象 少 、 垃 圾 对 象 多 的 前 提 下 
的 。 这 种 情况 在 年 轻 代 经 常 发生， 但 是 在 年 老 代 更 常见 的 情况 是 大 部 
分 对 象 都 是 存活 对 象 。 如 果 依 然 使 用 复制 算法 ， 由 于 存活 的 对 象 较 
多 ， 复 制 的 成 本 也 很 高 。 标 记 -压缩 算法 是 一 种 年 老 代 的 回收 算法 ， 它 
在 标记 -清除 算法 的 基础 上 做 了 一 些 优化 。 也 首先 需要 从 根 节点 开始 对 
所 有 可 达 对 象 做 一 次 标记 ， 但 之 后 ， 它 并 不 简单 地 清理 未 标记 的 对 
象 ， 而 是 将 所 有 的 存活 对 象 压缩 到 内 存 的 一 端 。 之 后 ， 清 理 边界 外 所 
有 的 空间 。 这 种 方法 既 避 免 了 人 三 片 的 产生 ， 又 不 需要 两 块 相同 的 内 存 
空间 ， 因 此 ， 其 性 价 比较 高 。 

标记 -整理 算法 的 总 体 执行 效率 高 于 标记 -清除 算法 ， 又 不 像 复 制 算 
法 那样 需要 牺牲 一 半 的 存储 空间 ， 这 显然 是 一 种 非常 理想 的 结果 。 在 
许多 现代 的 垃圾 收集 器 中 ， 人 们 都 使 用 了 标记 -整理 算法 或 其 改进 版 
本 。 

7.3.2.6 增 量 算法 (Incremental Collecting) 

在 垃圾 回收 过 程 中 ， 应 用 软件 将 处 于 一 种 Stop the World 的 状态 。 
在 Stop the World 状 态 下 ， 应 用 程序 所 有 的 线程 都 会 挂 起 ， 暂 停 一 切 正 
常 的 工作 ， 等 待 垃圾 回收 的 完成 。 如 果 垃 圾 回收 时 间 过 长 ， 应 用 程序 


会 被 挂 起 很 久 ， 将 严重 影响 用 户 体 验 或 者 系统 的 稳定 性 。 为 了 解决 这 
个 问题 ， 即 对 实时 垃圾 收集 算法 的 研究 直接 导致 了 增 量 收集 算法 的 诞 
生 。 

最 初 ， 为 了 进行 实时 的 垃圾 收集 ， 可 以 设计 一 个 多 进程 的 运行 环 
境 ， 比 如 用 一 个 进程 执行 垃圾 收集 工作 ， 另 一 个 进程 执行 程序 代码 。 
这 样 一 来 ， 垃 圾 收集 工作 看 上 去 就 仿佛 是 在 后 台 悄悄 完成 的 ， 不 会 打 
断 程序 代码 的 运行 。 在 收集 餐巾 纸 的 例子 中 ， 这 一 思路 可 以 被 理解 
为 ， 垃 圾 收集 机 器 人 在 人 们 用 和 餐 的 同时 寻找 废弃 的 餐巾 纸 并 将 它们 扔 
到 垃圾 箱 里 。 这 个 看 似 简单 的 思路 会 在 设计 和 实现 时 磁 上 进程 间 冲 突 
的 难题 。 比 如 说 ， 如 果 垃 圾 收集 进程 包括 标记 和 清除 两 个 工作 阶段 ， 
那么 ， 垃 圾 收集 器 在 第 一 阶段 中 笠 平 昔 理 标记 出 的 结果 很 可 能 被 另 一 
个 进程 中 的 内 存 操作 代码 修改 得 面目 全 非 ， 以 至 于 第 二 阶段 的 工作 没 
有 办 法 开展 。 

M.L.Minsky 和 D.E.Knuth 对 实时 垃圾 收集 过 程 中 的 技术 难点 进行 了 
早期 的 研究 ，G.L.Steele 于 1975 年 发 表 了 题 为 “多 进程 整理 的 垃圾 收集 

(Multiprocessing Compactifying Garbage Collection) ”的 论文 ， 描 述 了 
一 种 被 后 人 称 为 “Minsky-Knuth-Steele 算 法 ”的 实时 垃圾 收集 算法 。 
E.W.Dijkstra，L.Lamport，R.R.Fenichel/ 和 J.C.Yochelson 等 人 也 相继 在 此 
领域 做 出 了 各 自 的 贡献 。1978 年 ，H.G.Baker 发 表 了 “ 串 行 计算 机 上 的 实 
时 表 处 理 技 术 (List Processing in Real Time on a Serial Computer) ”一 
文 ， 系 统 曾 述 了 多 进程 环境 下 用 于 垃圾 收集 的 增 量 收集 算法 。 

增 量 算法 的 基本 思想 是 ， 如 果 一 次 性 将 所 有 的 垃圾 进行 处 理 ， 需 
要 造成 系统 长 时 间 的 停顿 ， 那 么 就 可 以 让 垃圾 收集 线程 和 应 用 程序 线 
程 交 替 执 行 。 每 次 ， 垃 圾 收集 线程 只 收集 一 小 片区 域 的 内 存 空间 ， 接 
着 切换 到 应 用 程序 线程 。 依 次 反复 ， 直 到 垃圾 收集 完成 。 使 用 这 种 方 
式 ， 由 于 在 垃圾 回收 过 程 中 ， 间 断 性 地 执行 了 应 用 程序 代码 ， 所 以 能 
减少 系统 的 停顿 时 间 。 但 是 ， 因 为 线程 切换 和 上 下 文 转 换 的 消耗 ， 会 
使 得 垃圾 回收 的 总 体 成 本 上 升 ， 造 成 系统 吞吐 量 的 下 降 。 

总 的 来 说 ， 增 量 收集 算法 的 基础 仍 是 传统 的 标记 -清除 和 复制 算 
法 。 增 量 收 集 算 法 通过 对 进程 间 冲 突 的 妥善 处 理 ， 人 允许 垃圾 收集 进程 
以 分 阶段 的 方式 完成 标记 、 清 理 或 复制 工作 。 

7.3.2.7 分 代 收 集 算法 (Generational Collecting) 


1980 年 前 后 ， 善 于 在 研究 中 使 用 统计 分 析 知 识 的 技术 人 员 发 现 ， 
大 多 数 内 存 块 的 生存 周期 都 比较 短 ， 垃 圾 收集 器 应 当 把 更 多 的 精力 放 
在 检查 和 清理 新 分 配 的 内 存 块 上 。 还 是 餐巾 纸 的 例子 ， 如 果 垃 圾 收集 
机 器 人 足够 聪明 ， 事 先 摸 清 了 和 餐厅 里 每 个 人 在 用 和 餐 时 使 用 餐巾 纸 的 习 
惯 一 比如 有 些 人 喜欢 在 用 餐 前 后 各 用 掉 一 张 餐巾 纸 ， 有 的 人 喜欢 自 始 
至 终 搬 着 一 张 餐 巾 纸 不 放 ， 有 的 人 则 每 打 一 个 喷 呈 就 用 去 一 张 餐 巾 纸 
一 机 器 人 就 可 以 制定 出 更 完善 的 餐巾 纸 回收 计划 ， 并 总 是 在 人 们 刚 扔 
掉 餐 巾 纸 没 多 久 就 把 垃圾 擒 走 。 这 种 基于 统计 学 原理 的 做 法 当然 可 以 
让 和 餐厅 的 整洁 度 成 倍 提高 。D.E.Knuth，T.Knight，G.Sussman 和 
R.Stallman 等 人 对 内 存 垃圾 的 分 类 处 理 做 了 最 早 的 研究 。1983 年 ， 
H.Lieberman 和 C.Hewitt 发 表 了 题 为 “基于 对 象 寿 命 的 一 种 实时 垃圾 收集 
器 (A real-time garbage collector based on the lifetimes of objects) ”的 论 
文 。 这 篇 著名 的 论文 标志 着 分 代 收 集 算法 的 正式 诞生 。 此 后 , 在 
H.G.Baker，R.L.Hudson，JE.B.Moss 等 人 的 共同 努力 下 ， 分 代 收 集 算法 
逐渐 成 为 了 垃圾 收集 领域 里 的 主流 技术 。 

根据 垃圾 回收 对 象 的 特性 ， 使 用 合适 的 算法 回收 ， 分 代 既 是 基于 
这 种 思想 ， 它 将 内 存 区 间 根 据 对 象 的 特点 分 成 几 块 ， 根 据 每 块 内 存 区 
间 的 特点 ， 使 用 不 同 的 回收 算法 ， 以 提高 垃圾 回收 的 效率 。 

以 Hot Spot 虚拟 机 为 例 ， 它 将 所 有 的 新 建 对 象 都 放 入 称 为 年 轻 代 的 
内 存 区 域 ， 年 轻 代 的 特点 是 对 象 会 很 快 回 收 ， 因 此 ， 在 年 轻 代 就 选择 
效率 较 高 的 复制 算法 。 当 一 个 对 象 经 过 几 次 回收 后 依然 存活 ， 对 象 就 
会 被 放 入 称 为 年 老 代 的 内 存 空 间 。 在 年 老 代 中 ， 几 乎 所 有 的 对 象 都 是 
经 过 几 次 垃圾 回收 后 依然 得 以 幸存 的 。 因 此 ， 可 以 认为 这 些 对 象 在 一 
段 时 期 内 ， 甚 至 在 应 用 程序 的 整个 生命 周期 中 ， 将 是 常 驻 内 存 的 。 如 
果 依 然 使 用 复制 算法 回收 年 老 代 ， 将 需要 复制 大 量 对 象 。 再 加 上 年 老 
代 的 回收 性 价 比 也 要 低 于 年 轻 代 ， 因 此 这 种 做 法 也 是 不 可 取 的 。 根 据 
分 代 的 思想 ， 可 以 对 年 老 代 的 回收 使 用 与 年 轻 代 不 同 的 标记 -压缩 算 
法 ， 以 提高 垃圾 回收 效率 。 

总 的 来 说 ， 分 代 收 集 算法 是 基于 对 对 象 生 命 周 期 分 析 后 得 出 的 垃 
圾 回收 算法 。 它 把 对 象 分 为 年 青 代 、 年 老 代 、 持 久 代 ， 对 不 同 生命 周 
期 的 对 象 使 用 不 同 的 算法 (上 述 方式 中 的 一 个 ) 进行 回收 。JVM 垃 专 
回收 器 (从 J2SE1.2 开 始 ) 都 是 使 用 此 算法 的 。 


7.3.3 垃圾 收集 器 


7.3.3.1 垃圾 收集 器 分 类 

由 于 JDK 的 版 本 处 于 高 速 迭代 过 程 中 ， 因 此 Java 从 发 展 至 今 已 经 衍 
生 了 众多 的 GC 版 本 ， 比 如 Serial/Serial Old 收 集 器 、ParNew 收 集 器 、 
Parallel/Parallel Old 收 集 器 、CMS (Concurrent-Mark-Sweep) 收集 器 ， 
以 及 从 JDK7 Update4 版 本 开始 提供 的 G1 (Garbage-First) 收集 器 等 。 

基于 分 代 的 概念 ， 不 同 的 代 空 间 中 均 活 动 着 不 同 的 GC， 比 如 Serial 
收集 器 就 是 一 个 典型 的 新 生 代 垃圾 收集 器 ， 它 采用 复制 算法 回收 新 生 
代 无 用 对 象 的 内 存 空 间 。 当 然 ，JVM 在 实际 运行 过 程 中 ， 新 生 代 和 老 
年 代 中 各 上 自 的 GC 需要 组 合 在 一 起 共同 执行 垃圾 回收 任务 。 如 果 新 生 代 
的 GC 和 老年 代 的 GC 相连 ， 则 意味 着 可 以 组 合 在 一 起 使 用 ， 不 过 在 实际 
开发 过 程 中 ， 新 生 代 和 老年 代 的 GC 的 组 合 方式 还 需要 结合 具体 的 应 用 
场景 进行 分 析 后 得 到 。 

从 不 同 角度 分 析 垃 圾 收集 器 ， 可 以 将 GC 分 为 不 同 的 类 型 。 

按 绪 程 数 分 ， 可 以 分 为 串 行 垃圾 回收 右 和 并 行 垃圾 回收 右 。 串 行 
垃圾 回收 器 一 次 只 使 用 一 个 线程 进行 垃圾 回收 ;并 行 垃圾 回收 器 一 次 
将 开局 多 个 线程 同时 进行 垃圾 回收 。 在 并 行 能 力 较 强 的 CPU 上 ， 使 用 
并 行 垃 圾 回收 器 可 以 缩短 GC 的 停顿 时 间 。 

按照 工作 模式 分 ， 可 以 分 为 并 发 式 垃圾 回收 器 和 独占 式 垃 圾 回收 
器 。 并 发 式 垃 圾 回收 器 与 应 用 程序 线程 交替 工作 ， 以 尽 可 能 减少 应 用 
程序 的 停顿 时 间 ; 独占 式 垃圾 回收 器 (Stop the world) 一 旦 运行 ， 就 
停止 应 用 程序 中 的 其 他 所 有 线程 ， 直 到 垃圾 回收 过 程 完全 结束 。 

按 碎片 处 理 方式 可 分 为 讨 缩 式 垃圾 回收 器 和 非 讨 缩 式 垃 圾 回收 
器 。 庄 缩 式 垃圾 回收 器 会 在 回收 完成 后 ， 对 存活 对 象 进 行 压 缩 整 理 ， 
消除 回收 后 的 碎片 ， 非 压缩 式 的 垃圾 回收 器 不 进行 这 步 操作 。 

按 工 作 的 内 存 区 间 ， 又 可 分 为 年 轻 代 垃圾 回收 器 和 年 老 代 垃 圾 回 
收 器 。 下 面 开 始 对 这 些 型 式 进行 逐一 讨论 。 

7.3.3.2 串 行 回收 器 和 并 行 回收 器 

串 行 回收 指 的 是 在 同一 时 间 段 内 只 允许 一 件 事 情 发 生 ， 简 单 来 
说 ， 当 多 个 CPU 可 用 时 ， 也 只 能 有 一 个 CPU 用 于 执行 垃圾 回收 操作 ， 
并 且 在 执行 垃圾 回收 时 ， 程 序 中 的 工作 线程 将 会 被 暂停 ， 当 垃圾 收集 


工作 完成 后 才 会 恢复 之 前 被 暂停 的 工作 线程 ， 这 就 是 串 行 回收 。 不 过 
由 于 运行 在 客户 端 下 的 Client 模 式 的 JVM 并 没有 低 暂 停 时 间 的 要 求 ， 并 
且 Client 模 式 下 的 内 存 开销 相对 于 Server 模 式 来 说 也 更 小 ， 因 此 串 行 回 
收 默认 被 应 用 在 Client 模 式 下 的 JVM 中 。 和 串 行 回收 相反 ， 并 行 收 集 可 
以 运用 多 个 CPU 同时 执行 垃圾 回收 ， 因 此 提升 了 应 用 的 吞吐 量 ， 不 过 
并 行 回收 仍然 使 用 了 “Stop-the-world” 机 制 和 复制 算法 。 

串 行 收集 器 主要 有 两 个 特点 ， 首 先 ， 它 仅仅 使 用 单线 程 进行 垃圾 
回收 。 其 次 ， 它 独占 式 的 垃圾 回收 方式 。 

在 串 行 收 集 器 进行 垃圾 回收 时 ，Java 应 用 程序 中 的 线程 都 需要 和 暂 
停 ， 等 待 垃 圾 回收 的 完成 ， 这 样 给 用 户 体验 造成 较 差 效果 。 虽 然 如 
此 ， 串 行 收集 器 却 是 一 个 成 熟 、 经 过 长 时 间 生 产 环境 考验 的 极为 高 效 
的 收集 器 。 年 轻 代 串 行 处 理 器 使 用 复制 算法 ， 实 现 相 对 简单 ， 逻 辑 处 
理 特 别 高 效 ， 且 没有 线程 切换 的 开销 。 在 诸如 单 CPU 处 理 器 或 者 较 小 
的 应 用 内 存 等 硬件 平台 不 是 特别 优越 的 场合 ， 它 的 性 能 表现 可 以 超过 
并 行 回收 器 和 并 发 回收 器 。 

并 行 收 集 器 是 工作 在 年 轻 代 的 垃圾 收集 器 ， 它 只 简单 地 将 串 行 回 
收 器 多 线程 化 。 它 的 回收 策略 、 算 法 以 及 参数 和 串 行 回收 器 一 样 。 

并 行 回 收 器 也 是 独占 式 的 回收 器 ， 在 收集 过 程 中 ， 应 用 程序 会 全 
部 暂停 。 但 由 于 并 行 回 收 器 使 用 多 线程 进行 垃圾 回收 ， 因 此 ， 在 并 发 
能 力 比 较 强 的 CPU 上 ， 它 产生 的 停顿 时 间 要 短 于 串 行 回收 器 ， 而 在 单 
CPU 或 者 并 发 能 力 较 弱 的 系统 中 ， 并 行 回收 器 的 效果 不 会 比 串 行 回 收 
器 好 ， 由 于 多 线程 的 压力 ， 它 的 实际 表现 很 可 能 比 串 行 回收 器 差 。 

7.3.3.3 Serial 收 集 器 


Serial 收 集 器 作用 于 新 生 代 中 ， 它 采用 复制 算法 、 串 行 回 收 和 
“Stop-the-World” 机 制 的 方式 执行 内 存 回收 。 在 早期 的 JDK 版 本 中 ， 由 
于 那个 年 代 的 CPU 速度 并 没有 这 么 快 ， 所 以 在 CPU 受 限 于 单个 CPU 的 情 
况 下 ， 使 用 Serial 收 集 器 执行 新 生 代 垃圾 收集 几乎 是 唯一 的 选择 ， 并 且 
Serial 收 集 器 默认 也 作为 HotSpot 中 Client 模 式 下 的 新 生 代 垃 圾 收集 器 。 

除了 新 生 代 之 外 ，Serial 收 集 器 还 提供 用 于 执行 老年 代 垃 圾 收集 的 
Serial Old 收 集 器 。 Serial Old 收集 器 同样 也 采用 了 串 行 回收 和 *Stop-the- 
World” 机 制 ， 只 不 过 内 存 回 收 算法 使 用 电 俄 式 标记 -压缩 算法 。 在 此 需 
要 注意 的 是 ， 如 果 JVM 受 限于 单个 CPU 的 环境 下 ， 使 用 Serial 收 集 器 加 


上 Serial Old 收 集 器 的 组 合 执行 Client 模 式 下 的 内 存 回收 将 会 是 不 错 的 选 
择 。 基 于 串 行 回收 的 垃圾 收集 器 适用 于 大 多 数 对 暂停 时 间 要 求 不 高 的 
Client 模 式 下 的 JVM， 由 于 CPU 不 需要 频繁 地 做 任务 切换 ， 因 此 可 以 有 
效 避 免 多 线程 交互 过 程 中 产生 的 一 些 额 外 开销 ， 虽 然 执 行 串 行 回收 会 
降低 程序 的 吞吐 量 ， 但 是 回收 质量 还 是 不 错 的 。 在 程序 中 ， 开 发 人 员 
可 以 通过 选项 “-XX: +UseSerialGC” 手 动 指定 使 用 Serial 收 集 器 执行 内 存 
回收 任务 。 

我 们 可 以 把 上 面 的 内 容 总 结 如 下 : 
(1) 该 算法 的 第 一 步 是 在 老年 代 标 记 存活 的 对 象 ; 
(2) 从 头 开始 检查 堆 内 存 空间 ， 并 且 只 留 下 依然 幸存 的 对 象 CA 
BR) ; 

(3) 最 后 一 步 ， 从 头 开 始 ， 顺 序 地 填 满 堆 内 存 空间 ， 将 存活 的 对 
象 连续 存放 在 一 起 ， 这 样 堆 分 成 两 部 分 ， 一 边 有 存放 的 对 象 ， 一 边 没 
ANR (BE) ; 

(4) Serial 收 集 器 应 用 于 小 的 存储 器 和 少量 的 CPU。 

@ 年 轻 代 串 行 收 集 器 

在 HotSpot 虚 拟 机 中 ， 使 用 -XX: +UseSerialGC 人 参数 可 以 指定 使 用 
年 轻 代 串 行 收集 器 和 年 老 代 串 行 收集 器 。 当 JVM 在 Client 模 式 下 运行 
时 ， 它 是 默认 的 垃圾 收集 器 。 

清单 7-11 所 示 是 一 次 年 轻 代 串 行 收 集 器 的 工作 输出 日 志 ， 信 息 如 下 
所 示 (使 用 -XX: +PrintGCDetails 开 关 ) 。 


代码 清单 7-11 年 轻 代 串 行 收 集 器 工作 输出 
[GC [DefNew: 3468K->150K (9216K), 0.0028638 secs] [Tenured: 1562K-»1712K (10240K) , 
0.0084220 secs] 3468K->1712K(19456K), [Perm : 377K->377K(12288K)], 0.0113816 secs] 


[Times: user-0.02 sys=0.00, real=0.01 secs] 


上 面 的 输出 显示 了 一 次 垃圾 回收 前 的 年 轻 代 的 内 存 占用 量 和 垃圾 
回收 后 的 年 轻 代 内 存 占用 量 ， 以 及 垃圾 回收 所 消耗 的 时 间 。 

@ 年 老 代 串 行 收集 器 

前 面 提起 过 ， 年 老 代 串 行 收集 器 使 用 的 是 标记 -压缩 算法 。 和 年 轻 
代 串 行 收集 器 一 样 ， 它 也 是 一 个 串 行 的 、 独 占 式 的 垃圾 回收 器 。 由 于 


年 老 代 垃圾 回收 通常 会 使 用 比 年 轻 代 垃圾 回收 更 长 的 时 间 ， 因 此 ， 在 
堆 空 间 较 大 的 应 用 程序 中 ， 一 旦 年 老 代 串 行 收集 器 启动 ， 应 用 程序 很 
可 能 会 因此 停顿 几 秒 甚至 更 长 时 间 。 

虽然 如 此 ， 年 老 代 串 行 回收 器 可 以 和 多 种 年 轻 代 回收 器 配合 使 
用 ， 同 时 它 也 可 以 作为 CMS 回收 器 的 备用 回收 器 。 

若 要 启用 年 老 代 串 行 回收 器 ， 可 以 党 试 使 用 以 下 参数: 

-XX: +UseSerialGC: 年 轻 代 、 年 老 代 都 使 用 串 行 回收 器 ; 

输出 如 清单 7-12 所 示 。 


代码 清单 7-12 使 用 -XX:+UseSerialGC 参数 
Heap 
def new generation total 4928K, used 1373K [0x27010000, 0x27560000, 0x2c560000) 
eden space 4416K, 31$ used [0x27010000, 0x27167628, 0x27460000) 
from space 512K, 0$ used [0x27460000, 0x27460000, 0x274e0000) 
to space 512K, 0$ used [0x274e0000, 0x274e0000, 0x27560000) 
tenured generation total 10944K, used 0K [0x2c560000, 0x2d010000, 0x37010000) 
the space 10944K, 0% used [0x2c560000, 0x2c560000, 0x2c560200, 0x2d010000) 
compacting perm gen total 12288K, used 376K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706e0b8, 0x3706e200, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw Space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


我 们 也 可 以 使 用 -XX: +UseParNewGC 参 数 ， 当 使 用 它 作 为 JVM 参 
数 时 ， 指 定年 轻 代 使 用 并 行 收 集 器 ， 年 老 代 使 用 串 行 收集 器 。 输 出 如 
下 所 示 。 

7.3.3.4 ParNew 收 集 器 


如 果 说 Serial 是 新 生 代 中 的 单线 程 垃圾 收集 器 ， 那 么 ParNew 收 集 器 
则 是 Serial 收 集 器 的 多 线程 版 本 。ParNew 收 集 器 除了 采用 并 行 回 收 的 方 
式 执 行内 存 回收 外 ， 两 款 垃 圾 收集 器 之 间 几 乎 没有 任何 区 别 ， 因 为 
ParNew 收 集 器 在 新 生 代 中 同样 也 是 采用 复制 算法 和 “Stop-the-World” 机 
制 。 


如 果 说 ParNew 收 集 器 运行 在 多 CPU 的 环境 下 ， 由 于 可 以 充分 利用 
多 CPU、 多 核心 等 物理 硬件 资源 优势 ， 确 实 可 以 更 快速 地 完成 垃圾 收 
集 ， 提 升 程 序 的 吞吐 量 ， 但 是 如 果 是 在 单个 CPU 的 环境 下 ，ParNew 收 
集 器 不 见得 比 Serial 收 集 器 更 高 效 。 虽 然 Serial 收 集 器 是 基于 串 行 回收 ， 
但 是 由 于 CPU 不 需要 频繁 地 做 任务 切换 ， 因 此 可 以 有 效 避 免 多 线程 交 
互 过 程 中 产生 的 一 些 额外 开销 。 所 以 从 理论 上 来 说 ，Serial 收 集 器 的 优 
势 是 在 JVM 受 限于 单 CPU 环 境 中 ， 而 ParNew 收 集 器 的 优势 则 是 体现 在 
多 CPU、 多 核心 的 环境 中 ， 并 且 在 某 些 注重 低 延 迟 的 应 用 场景 下 
ParNew 收 集 器 和 CMS (Concurrent-Mark-Sweep) 收集 器 的 组 合 模 x. ; 
在 Server 模 式 下 的 内 存 回 收效 果 很 好 。 在 程序 中 ， 开 发 人 员 可 以 通过 选 
项 “-XX: +UseParNewGC” 手 动 指定 使 用 ParNew 收 集 器 执行 内 存 回收 任 


务 。 


代码 清单 7-13 使 用 -XX:+UseParNewGC 参数 
Heap 
par new generation total 4928K, used 1373K [0x0£010000, 0x0£560000, 0x14560000) 
eden space 4416K, 31% used [0x0£010000, 0x0f167620, 0x0£460000) 
from space 512K, 0% used [0x0£460000, 0x0£460000, 0x0f£4e0000) 
to space 512K, 0% used [0x0f4e0000, 0x0f4e0000, 0x0£560000) 


tenured generation total 10944K, used OK [0x14560000, 0x15010000, 0x1£010000) 
the space 10944K, 0$ used [0x14560000, 0x14560000, 0x14560200, 0x15010000) 
compacting perm gen total 12288K, used 2056K [0x1£010000, 0x1fc10000, 0x23010000) 
the space 12288K, 16% used [0x1f010000, 0x1£2121d0, 0x1f212200, 0x1fc10000) 


No shared spaces configured. 


如 果 使 用 参数 -XX: +UseParallelGC 配 置 JVM ， 表 示 年 轻 代 使 用 并 
行 回收 收集 器 ， 年 老 代 使 用 串 行 收 集 器 。 输 出 如 清单 7-14 所 示 。 


代码 清单 7-14 使 用 -XX:+UseParallelGC 参数 
Heap 


PSYoungGen total 4800K, used 1380K [0x1dac0000, 0x1e010000, 0x23010000) 


eden space 4160K, 33$ used [0xldac0000,0x1dc19130, 0xlded0000) 

from space 640K, 0$ used [0x1d£70000,0x1d£70000,0x1e010000) 

to space 640K, 0% used [0x1ded0000,0x1ded0000,0x1df70000) 
PSOldGen total 10944K, used OK [0x13010000, 0x13ac0000, 0x1dac0000) 
object space 10944K, 0$ used [0x13010000,0x13010000,0x13ac0000) 
PSPermGen total 12288K, used 2056K [0x0f010000, Ox0fc10000, 0x13010000) 
object space 12288K, 16% used [0x0£010000, 0x0£2121d0, 0x0fc10000) 


一 次 年 老 代 串 行 回收 器 的 工作 输出 如 清单 7-15 所 示 。 


代码 清单 7-15 老年 代 串 行 回收 器 输出 


[Full GC [Tenured: 1712K-51699K(10240K), 0.0071963 secs] 1712K-51699K(19456K), 
[Perm : 377K->372K (12288K) ], 0.0072393 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 


上 面 的 输出 显示 了 垃圾 回收 前 年 老 代 和 永久 区 的 内 存 占用 量 ， 以 
及 垃圾 回收 后 年 老 代 和 永久 区 的 内 存 使 用 量 。 


开启 并 行 回 收 器 可 以 使 用 参数 -XX: +UseParNewGC， 它 表示 年 轻 
代 使 用 并 行 收 集 器 ， 年 老 代 使 用 串 行 收集 器 。 输 出 如 清单 7-16 所 示 。 


代码 清单 7-16 使 用 -XX:+UseParNewGC 参数 
[GC [ParNew: 825K->161K(4928K), 0.0155258 secs][Tenured: 8704K->661K(10944K) ， 
0.0071964 secs] 9017K->661K(15872K), [Perm : 2049K->2049K(12288K)], 0.0228090 secs] 
[Times: user=0.01 sys-0.00, real=0.01 secs] 
Heap 
par new generation total 4992K, used 179K [0x0£010000, 0x0£570000, 0x14560000) 
eden space 4480K, 4% used [0x0f010000, 0x0f03cda8, 0x0£470000) 
from space 512K, 0% used [0x0£470000, 0x0£470000, 0x0f4f0000) 
to space 512K, 0% used [0x0f4f0000, 0x0f4f0000, 0x0£570000) 
tenured generation total 10944K, used 8853K [0x14560000, 0x15010000, 0x1£010000) 
the space 10944K, 80% used [0x14560000, 0x14e057c0, 0x14e05800, 0x15010000) 
compacting permgen total 12288K, used 2060K [0x1£010000, 0x1fc10000, 0x23010000) 
the space 12288K, 16% used [0x1f010000, 0x1£213228, 0x1f213400, 0x1fc10000) 


No shared spaces configured. 


7.3.3.5 Parallel 收 集 器 


就 目前 而 言 ，HotSpot 的 新 生 代 中 除了 拥有 ParNew 收 集 器 是 基于 并 
行 回收 的 以 外 ，Parallel 收 集 器 同样 也 采用 了 复制 算法 、 并 行 回收 和 
“Stop-the-World” 机 制 。 和 ParNew 收 集 器 不 同 ，Parallel 收 集 器 可 以 控制 
程序 的 吞吐 量 大 小 ， 因 此 它 也 被 称 为 吞吐 量 优先 的 垃圾 收集 器 。 在 程 
序 中 ， 开 发 人 员 可 以 通过 选项 <-XX: GCTimeRatio” 设 置 执 行内 存 回收 
的 时 间 所 占 JVM 运 行 总 时 间 的 比例 ， 也 就 是 控制 GC 的 执行 频率 ， 公 式 
为 11 (1+N) ， 默 认 值 为 99， 也 就 是 说 ， 将 只 有 1% 的 时 间 用 于 执行 垃 
圾 回收 。 除 此 之 外 ，Paralel 收 集 器 还 提供 选项 “-XX : 
MaxGCPauseMills” 设 置 执行 内 存 回收 时 “Stop-the-World” 机 制 的 暂停 时 
间 阅 值 ， 如 果 指 定 了 该 选项 ，Parallel 收 集 器 将 会 尽 可 能 地 在 设 定 的 时 
间 沁 围 内 完成 内 存 回收 。 

需要 注意 的 是 ， 垃 圾 收集 器 中 吞吐 量 和 低 延 迟 这 两 个 目标 本 身 是 
相互 矛盾 的 ， 因 为 如 果 选 择 以 吞吐 量 优先 ， 那 么 必然 需要 降低 内 存 回 
收 的 执行 频率 ， 但 是 这 样 会 导致 GC 需要 更 长 的 暂停 时 间 来 执行 内 存 回 
授 。 相 反 的 ， 如 果 选 择 以 低 延 迟 优先 为 原则 ， 那 么 为 了 降低 每 次 执行 


内 存 回 收 时 的 暂停 时 间 ， 也 只 能 频繁 地 执行 内 存 回 收 ， 但 这 又 引起 了 
新 生 代 内 存 的 缩 威 和 导致 程序 吞吐 量 的 下 降 。 举 个 例子 ， 在 60s 的 JVM 
总 运行 时 间 里 ， 每 次 GC 的 执行 频率 是 20s/ 次 ， 那 么 60s 内 一 共 会 执行 3 
次 内 存 回 授 ， 按 照 每 次 GC 耗 时 100ms 来 计算 ， 最终 一 共 会 有 300ms 
(3*100) 被 用 于 执行 垃圾 回收 。 但 是 如 果 我 们 将 选项 “-XxX: 
MaxGCPauseMills” 的 值 调 小 后 ， 新 生 代 的 内 存 空间 也 会 自动 调整 ， 内 
存 空间 越 小 就 越 容 易 被 耗 尽 ， 也 就 越 容 易 造 成 GC 的 执行 频繁 发 生 。 之 
前 在 60s 的 JVM 总 运行 时 间 里 ， 最 终 会 有 300ms 被 用 于 执行 内 存 回 收 ， 
而 如 今 GC 的 执行 频率 却 是 10s/ 次 ，60s 内 将 会 执行 6 次 内 存 回 授 ， 按 照 
每 次 GC 耗 时 60ms 来 计算 ， 虽 然 看 上 去 暂停 时 间 更 短 了 ， 但 最 终 会 耗 时 
360ms (6*60) 用 于 执行 内 存 回收 ， 很 明显 程序 的 吞吐 量 下 降 了 。 所 以 
大 家 在 设置 这 两 个 选项 时 ， 一 定 需要 注意 控制 在 一 个 折 中 的 范围 之 
内 。 Parallel 收 集 器 还 提供 一 个 “-XX: UseAdaptiveSizePolicy” 选 项 用 于 
设置 GC 的 自动 分 代 大 小 调节 策略 ， 一 旦 设置 这 个 选项 后 ， 就 意味 着 开 
发 人 员 将 不 再 需要 显 式 地 设置 新 生 代 中 的 一 些 细节 参数 ，JVM 会 根据 
自身 的 当前 运行 情况 动态 调整 这 些 相关 参数 。 

和 Serial 收 集 器 一 样 ，Parallel 收 集 器 也 提供 用 于 执行 老年 代 垃 圾 收 
集 的 ParallelOld 收 集 器 ，Parallel Old 收集 器 采用 了 标记 -压缩 算法 ， 但 同 
样 也 是 基于 并 行 回收 和 “Stop-the-World” 机 制 。 在 程序 吞吐 量 优先 的 应 
用 场景 中 ，Parallel 收 集 器 和 Parallel Old 收 集 器 的 组 合 ， 在 Server 模 式 下 
的 内 存 回收 性 能 很 不 错 。 在 程序 开发 过 程 中 ， 开 发 人 员 可 以 通过 选项 “- 
XX: +UseParallelGC” 手 动 指定 使 用 Parallel 收 集 器 执行 内 存 回收 任务 。 

虽 年 轻 代 并 行 回收 (Parallel Scavenge) 收集 器 


年 轻 代 并 行 回 收 收 集 器 也 是 使 用 复制 算法 的 收集 器 。 从 表面 上 
看 ， 它 和 并 行 收集 器 一 样 都 是 多 线程 、 独 占 式 的 收集 器 。 但 是 ， 并 行 
回收 收集 器 有 一 个 重要 的 特点 : 它 非常 关注 系统 的 否 吐 量 。 

年 轻 代 并 行 回收 收集 器 可 以 使 用 以 下 参数 启用 : 

-XX: +UseParallelGC: 年 轻 代 使 用 并 行 回收 收集 器 ， 年 老 代 使 用 
串 行 收集 器 。 


-XX: +UseParallelOldGC: 年 轻 代 和 年 老 代 都 是 用 并 行 回收 收集 
Tio 


设 定 线程 数量 为 24 时 ， 运 行 输出 如 清单 7-17 所 示 。 


代码 清单 7-17 24 个 线程 的 Parallel 收集 器 

Heap 

PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000) 
eden space 4160K, 21% used [0x1dac0000,0x1db9f570,0x1ded0000) 
from space 640K, 0$ used [0xld£70000,0x1d£70000,0x1e010000) 
to space 640K, 0% used [0xlded0000,0xlded0000, 0x1d£70000) 

ParOldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000) 
object space 19200K, 85$ used [0x13010000,0x14010020, 0x142d0000) 

PSPermGen total 12288K, used 2054K [0x0f010000, Ox0fc10000, 0x13010000) 
object space 12288K, 16% used [0x0f010000,0x0£2119c0,0x0f£c10000) 


年 轻 代 并 行 回收 收集 器 可 以 使 用 以 下 参数 启用 : 

-XX: +MaxGCPauseMills: 设置 最 大 垃圾 收集 停顿 时 间 ， 它 的 值 
是 一 个 大 于 0 的 整数 。 收 集 器 在 工作 时 会 调整 Java 堆 大 小 或 者 其 他 一 些 
参数 ， 尽 可 能 地 把 停顿 时 间 控 制 在 MaxGCPauseMills 以 内 。 如 果 希 望 减 
少 停顿 时 间 ， 而 把 这 个 值 设 置 得 很 小 ， 为 了 达到 预期 的 停顿 时 间 ， 
JVM 可 能 会 使 用 一 个 较 小 的 堆 〈 一 个 小 堆 比 一 个 大 堆 回 收 快 ) ， 而 这 
将 导致 垃圾 回收 变 得 很 频繁 ， 从 而 增加 了 垃圾 回收 总 时 间 ， 降 低 了 厨 
吐 量 。 

-XX: +GCTimeRatio: 设置 吞吐 量 大 小 ， 它 的 值 是 一 个 0-100 之 间 
的 整数 。 假 设 GCTimeRatio 的 值 为 n， 那 么 系统 将 花费 不 超过 1/ (1+n) 
的 时 间 用 于 垃圾 收集 。 比 如 GCTimeRatio 等 于 19， 则 系统 用 于 垃圾 收集 
的 时 间 不 超过 1/ (1-19) =5%。 默 认 情 况 下 ， 它 的 取 值 是 99， 即 不 超过 
1% 的 时 间 用 于 垃圾 收集 。 

除 此 之 外 ， 并 行 回收 收集 器 与 并 行 收集 器 另 一 个 不 同 之 处 在 于 ， 
它 支 持 一 种 自 适 应 的 GC 调节 策略 ， 使 用 -XX: +UseAdaptiveSizePolicy 
可 以 打开 自 适应 GC 策略 。 在 这 种 模式 下 ， 年 轻 代 的 大 小 、eden 和 
survivor 的 比例 、 晋 升 年 老 代 的 对 象 年 龄 等 参数 会 被 自动 调整 ， 已 达到 
在 堆 大 小 、 吞 吐 量 和 停顿 时 间 之 间 的 平衡 点 。 在 手工 调 优 比较 困难 的 
场合 ， 可 以 直接 使 用 这 种 自 适 应 的 方式 ， 仅 指定 虚拟 机 的 最 大 堆 、 目 
标的 吞吐 量 (GCTimeRatio) 和 停顿 时 间 (MaxGCPauseMills) ， 让 虚 
拟 机 自己 完成 调 优 工作 。 


年 轻 代 并 行 回收 收集 器 的 工作 日 志 如 清单 7-18 所 示 。 


代码 清单 7-18 年 轻 代 并 行 回收 收集 怖 工作 日 志 

Heap 

PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000) 
eden space 4160K, 21$ used [0x1dac0000,0x1db9f570,0x1ded0000) 
from space 640K, 0% used [0x1df70000,0x1df70000,0x1e010000) 
to space 640K, 0% used [0x1ded0000,0x1ded0000,0x1df70000) 

PS0ldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000) 
object space 19200K, 85$ used [0x13010000,0x14010020,0x14240000) 

PSPermGen total 12288K, used 2054K [0x0f010000, Ox0fc10000, 0x13010000) 
object space 12288K, 16$ used [0x0£010000,0x0£2119c0, 0x0fc10000) 


上 面 的 日 志 显示 了 回收 前 的 内 存 大 小 和 回收 后 的 内 存 大 小 ， 以 及 
花费 的 时 间 。 

年 老 代 并 行 回收 收集 器 

年 老 代 的 并 行 回收 收集 器 也 是 一 种 多 线程 并 发 的 收集 器 。 和 年 轻 
代 并 行 回 收 收集 器 一 样 ， 它 也 是 一 种 关注 吞吐 量 的 收集 器 。 年 老 代 并 
行 回收 收集 器 使 用 标记 -压缩 算法 ，JDK1.6 之 后 开始 启用 。 

使 用 -XX: +UseParalleloldGC 可 以 在 年 轻 代 和 年 老 代 都 使 用 并 行 回 
收 收集 器 ， 这 是 一 对 非常 关注 吞吐 量 的 垃圾 收集 器 组 合 ， 在 对 吞吐 量 
敏感 的 系统 中 ， 可 以 考虑 使 用 。 参 数 -XX: ParallelGCThreads 也 可 以 用 
于 设置 垃圾 回收 时 的 线程 数量 。 

设置 线程 数量 为 100 时 年 老 代 并 行 回 收 收 集 器 输出 日 志 如 清单 7-19 
所 示 。 


代码 清单 -19 年 老 代 并 行 回收 收集 器 线程 100 时 日 志 

Heap 

PSYoungGen total 4800K, used 893K [0x1dac0000, 0x1e010000, 0x23010000) 
eden space 4160K, 21$ used [0x1dac0000, 0x1db9f570,0x1ded0000) 
from space 640K, 0% used [0x1df70000,0x1df£70000,0x1e010000) 
to space 640K, 0% used [0xlded0000,0x1ded0000, 0x1d£70000) 

ParOldGen total 19200K, used 16384K [0x13010000, 0x142d0000, 0x1dac0000) 
object space 19200K, 85% used [0x13010000,0x14010020,0x142d0000) 

PSPermGen total 12288K, used 2054K [0x0£010000, 0x0£c10000, 0x13010000) 
object space 12288K, 16$ used [0x0f010000,0x0f2119c0,0x0£c10000) 


7.3.3.6 CMS 收集 器 


CMS 全 称 是 Concurrent-Mark-Sweep。 前 面 说 过 ， 在 程序 吞吐 量 优 
先 的 应 用 场景 中 ，Parallel 收 集 器 和 Parallel Old 收集 器 的 组 合 ， 在 Server 
模式 下 的 内 存 回收 性 能 很 不 错 。 但 是 在 某 些 对 系统 响应 速度 要 求 比较 
高 的 项 目 中 ， 大 家 总 是 希望 系统 能 够 快速 做 出 响应 ， 而 不 愿意 看 到 过 
多 的 延迟 。 基 于 低 延 迟 的 考虑 ，JVM 的 设计 者 们 提供 了 基于 并 行 回 收 
的 CMS (Concurrent-Marking-Sweep) 收集 器 ， 它 是 一 款 优秀 的 老年 代 
垃圾 收集 器 ， 也 可 以 被 称 作 Mostly-Concurrent 收 集 器 。CMS 天 生 为 并 发 
而 生 ， 低 延迟 是 它 的 优势 ， 不 过 垃圾 收集 算法 却 并 没有 采用 标记 -复制 
算法 ， 而 是 采用 标记 -清除 算法 ， 并 且 也 会 因为 “Stop-the-world” 机 制 而 
出 现 短暂 的 暂停 。 

CMS 的 执行 过 程 可 以 分 为 4 个 主要 阶段 ， 即 初 (Initial- 
Mark) 阶段 、 并 发 标记 (Concurrent-Mark) 阶段 、 再 次 标记 

(Remark) 阶段 和 并 发 清除 (Concurrent-Sweep) 阶段 。 

CMS 收集 器 的 回收 周期 以 一 个 称 之 为 初始 标记 的 阶段 开始 ， 在 这 
个 阶段 中 ， 程 序 中 所 有 的 工作 线程 都 将 会 因为 “Stop-the-World” 机 制 | 而 
出 现 短暂 的 暂停 ， 这 个 阶段 的 主要 任务 就 是 标记 出 内 存 中 那些 被 根 对 
象 集合 所 连接 的 目标 对 象 是 否 可 达 ， 一 旦 标记 完成 之 后 就 会 恢复 之 前 
被 暂停 的 所 有 应 用 线程 。 接 下 来 将 会 进入 并 发 标记 阶段 ， 而 这 个 阶段 
的 主要 任务 就 是 将 之 前 的 不 可 达 对 象 标 记 为 垃圾 对 象 。 在 CMS 最 终 执 
行内 存 回收 之 前 ， 尽 管 看 上 去 这 些 垃圾 对 象 都 已 经 被 成 功 标 记 了 ， 但 


是 由 于 在 并 发 标记 阶段 中 ， 程 序 的 工作 线程 会 和 垃圾 收集 线程 同时 运 
行 或 者 交叉 运行 ， 因 此 在 并 发 标记 阶段 将 无 法 有 效 确 保 之 前 被 标记 为 
垃圾 的 无 用 对 象 的 引用 关系 遭 到 更 改 ， 为 了 解决 这 个 问题 ，CMS 会 进 
入 到 再 次 标记 阶段 ， 这 样 一 来 ， 程 序 会 因为 “Stop-the-World” 机 制 而 再 
次 出 现 短暂 的 暂停 ， 以 确保 这 些 垃圾 对 象 都 能 够 被 成 功 且 正确 地 标 
记 。 当 经 历 过 初始 标记 、 并 发 标记 和 再 次 标记 这 三 个 阶段 后 ，CMS 最 
终 将 会 进入 到 并 发 清除 阶段 执行 内 存 回收 ， 释 放 掉 无 用 对 象 所 占用 的 
内 存 空 间 。 

尽管 CMS 收集 器 采用 的 是 并 行 回收 ， 但 是 在 其 初始 化 标记 和 再 次 
标记 这 两 个 阶段 中 仍然 需要 执行 “Stop-the-World” 机 制 暂停 程序 中 的 工 
作 线 程 ， 不 过 和 暂停 时 间 并 不 会 太 长 ， 因 此 可 以 说 明 目 前 所 有 的 垃圾 收 
集 器 都 做 不 到 完全 不 需要 “Stop-the-World”， 只 是 尽 可 能 地 降低 暂停 时 
间 。 

之 前 介绍 的 几 款 老年 代 垃 圾 收集 器 ， 比 如 Serial Old 收集 器 、 
Parallel Old 收集 器 的 垃圾 收集 算法 都 是 采用 标记 -压缩 来 避免 执行 Full 
GC 后 产生 内 存 碎 片 ， 而 CMS 收集 器 的 垃圾 收集 算法 采用 的 是 标记 -清除 
算法 ， 这 意味 着 每 次 执行 完 内 存 回 收 后 ， 由 于 被 执行 内 存 回 收 的 无 用 
对 象 所 占用 的 内 存 空 间 极 有 可 能 是 不 连续 的 一 些 内 存 块 ， 不 可 避免 地 
将 会 产生 一 些 内 存 碎 片 。 那 么 CMS 在 为 新 对 象 分 配 内 存 空 间 后 ， 将 无 
法 使 用 指针 碰撞 (Bump the Pointer) 技术 ， 而 只 能 选择 空 亲 列表 (Free 
List) 执行 内 存 分 配 。 

在 HotSpot 中 ， 当 垃圾 收集 器 执行 完 内 存 回 收 后 ， 如 果 内 存 空间 中 
产生 内 存 碎 片 ， 那 么 则 只 能 选择 空 闪 列表 作为 内 存 分 配 算法 为 新 对 象 
分 配 内 存 空间 。 简 单 来 说 ,会 有 JVM 负 责 维 护 一 个 列表 ， 其 中 所 记录 
的 内 容 就 是 当前 内 存 空间 中 可 用 内 存 块 的 坐标 ， 当 执行 内 存 分 配 时 ， 
会 从 列表 中 定位 到 一 个 与 新 对 象 所 需 内 存 大 小 一 致 的 连续 内 存 块 用 于 
存储 生成 的 对 象 实 例 。 考 虑 到 内 存 碎 片 存 在 的 弊端 ，CMS 收 集 器 提供 
选项 “<-XX : +UseCMS-CompactAtFullCollection”， 用 于 指定 在 执行 完 
Full GC 后 是 否 对 内 存 空间 进行 压缩 整理 ， 以 此 避免 内 存 碎片 的 产生 。 
不 过 由 于 内 存 压 缩 整 理 过 程 无 法 并 发 执行 ， 所 融 来 的 问题 就 是 停顿 时 
间 变 得 更 长 了 ， 因 此 CMS 收集 器 还 提供 另外 一 个 选项 “-XX: 
CMSFullGCs-BeforeCompaction”， 用 于 设置 在 执行 多 少 次 Full GC 后 对 
内 存 空间 进行 压缩 整理 。 除 了 会 产生 内 存 人 碎片 外 ，CMS 收 集 器 还 存在 


一 个 不 容 忽 视 的 问题 ， 那 就 是 在 并 发 标记 阶段 由 于 程序 的 工作 线程 和 
垃圾 收集 线程 是 同时 运行 或 者 交叉 运行 的 ， 那 么 在 并 发 标记 阶段 如 果 
产生 新 的 垃圾 对 象 ，CMS 将 无 法 对 这 些 垃 圾 对 象 进行 标记 ， 最 终 会 导 
致 这 些 新 产生 的 垃圾 对 象 没 有 被 及 时 回收 ， 从 而 只 能 够 在 下 一 次 执行 
GC 时 释放 这 些 之 前 未 被 回收 的 内 存 空间 。 

尽管 Full GC 大 多 数 时 候 只 会 发 生 在 老年 代 垃圾 回收 阶段 ， 但 是 实 
Ex E Full GC 的 回收 范围 却 不 单单 仅 限 于 老年 代 中 ， 从 严格 意义 上 来 
it, Full GC 的 回收 范围 几乎 覆盖 了 整个 堆 空间 ， 因 此 Full GC 将 会 比 
Minor GC 耗费 更 长 的 时 间 来 完成 垃圾 收集 。 在 HotSpot 中 ， 除 了 CMS 收 
集 器 之 外 的 任何 老年 代 垃圾 收集 器 在 执行 内 存 回收 时 ， 都 将 会 执行 Full 
GC， 只 有 G1 收 集 器 较为 特殊 。CMS 收集 器 提供 选项 “-XX: 
CMSInitiatingOccupanyFraction” 用 于 设置 当 老 年 代 中 的 内 存 使 用 率 达 到 
多 少 百分比 的 时 候 执行 内 存 回收 ( 低 版 本 的 JDK 默 认 值 为 68%，JDK6 
及 以 上 版 本 默认 值 为 92%) ， 这 里 的 内 存 回 收 范围 仪 限 于 老年 代 ， 而 非 
整个 堆 空间 ， 因 此 通过 该 选项 便 可 以 有 效 降 低 Full GC 的 执行 次 数 。 当 
然 并 不 是 说 使 用 了 CMS 收 集 器 之 后 ， 就 永远 不 会 再 触发 Full GCS, 一 
E CMS 在 执行 过 程 中 出 现 “Promotion Failed” 或 “Concurrent Mode 
Failure” 时 ， 将 仍然 有 可 能 会 触发 Full GC 操作 。 在 程序 开发 过 程 中 ， 开 
发 人 员 可 以 通过 选项 <-XX: +UseConcMarkSweepGC” 来 手动 指定 使 用 
CMS 收集 器 执行 内 存 回收 任务 。 

CMS 收集 器 在 其 主要 的 工作 阶段 虽然 没有 暴力 地 彻底 暂停 应 用 程 
序 线程 ， 但 是 由 于 它 和 应 用 程序 线程 并 发 执行 ， 相 互 抢占 CPU， 所 以 
在 CMS 执行 期 内 对 应 用 程序 吞吐 量 造 成 一 定 影响 。CMS 默 认 启 动 的 线 
程 数 是 (ParallelGCThreads*3) /4) ，ParallelGCThreads 是 年 轻 代 并 行 
收集 器 的 线程 数 ， 也 可 以 通过 -XX: ParallelCMSThreads 参 数 手工 设 定 
CMS 的 线程 数量 。 当 CPU 资源 比较 紧张 时 ， 受 到 CMS 收集 器 线程 的 影 
响 ， 应 用 程序 的 性 能 在 垃圾 回收 阶段 可 能 会 非常 糟糕。 

由 于 CMS 收集 器 不 是 独占 式 的 回收 器 ， 在 CMS 回收 过 程 中 ， 应 用 
程序 仍然 在 不 停 地 工作 。 在 应 用 程序 工作 过 程 中 ， 又 会 不 断 地 产生 垃 
圾 。 这 些 新 生成 的 垃圾 在 当前 CMS 回收 过 程 中 是 无 法 清除 的 。 同 时 ， 
因为 应 用 程序 没有 中 断 ， 所 以 在 CMS 回收 过 程 中 ， 还 应 该 确保 应 用 程 
序 有 足够 的 内 存 可 用 。 因 此 ，CMS 收 集 器 不 会 等 待 堆 内 存 饱和 时 才 进 
行 垃圾 回收 ， 而 是 当前 堆 内 存 使 用 率 达 到 某 一 阅 值 时 ， 便 开始 进行 回 


收 ， 以 确保 应 用 程序 在 CMS 工作 过 程 中 依然 有 足够 的 空间 支持 应 用 程 
序 运行 。 

这 个 回收 辣 值 可 以 使 用 -XX: CMSInitiatingOccupancyFraction 来 指 
定 ， 默 认 是 68。 即 当年 老 代 的 空间 使 用 率 达 到 68% 时 ， 会 执行 一 次 
CMS 回 收 。 如 果 应 用 程序 的 内 存 使 用 率 增长 很 快 ， 在 CMS 的 执行 过 程 
中 ， 已 经 出 现 了 内 存 不 足 的 情况 ， 此 时 ，CMS 回 收 将 会 失败 ，JVM 将 
启动 年 老 代 串 行 收集 器 进行 垃圾 回收 。 如 果 这 样 ， 应 用 程序 将 完全 中 
断 ， 直 到 垃圾 收集 完成 ， 这 是 ， 应 用 程序 的 停顿 时 间 可 能 很 长 。 
此 ， 根 据 应 用 程序 的 特点 ， 可 以 对 -XX : 
CMSInitiatingOccupancyFraction 进 行 调 优 。 如 果 内 存 增长 缓慢 ， 则 可 以 
设置 一 个 稍 大 的 值 ， 大 的 阅 值 可 以 有 效 降低 CMS 的 触发 频率 ， 减 少年 
老 代 回收 的 次 数 可 以 较为 明显 地 改善 应 用 程序 性 能 。 反 之 ， 如 果 应 用 
程序 内 存 使 用 率 增 长 很 快 ， 则 应 该 降低 这 个 阅 值 ， 以 避免 频繁 触发 年 
Cr ERR. 

标记 -清除 算法 将 会 造成 大 量 内 存 碎 片 ， 离 散 的 可 用 空间 无 法 分 配 
较 大 的 对 象 。 在 这 种 情况 下 ， 即 使 堆 内 存 仍然 有 较 大 的 剩余 空间 ， 也 
可 能 会 被 迫 进行 一 次 垃圾 回收 ， 以 换取 一 块 可 用 的 连续 内 存 ， 这 种 现 
象 对 系统 性 能 是 相当 不 利 的 ， 为 了 解决 这 个 问题 ，CMS 收 集 器 还 提供 
了 几 个 用 于 内 人 存 压 缩 整理 的 算法 。 

-XX: +UseCMSCompactAtFullCollection 开 发 可 以 使 CMS 在 垃圾 收 
集 完成 后 ， 进 行 一 次 内 存 碎 片 整理 。 内 存 碎 片 的 整理 并 不 是 并 发 进行 
的 。-XX: CMSFullGCsBeforeCompaction 参 数 可 以 用 于 设 定 进 行 多 少 
次 CMS 回收 后 ， 进 行 一 次 内 存 压 缩 。 

-XX : CMSlnitiatingOccupancyFractio 设置 为 100， 设 置 -XX : 
+UseCMSCompactAtFullCollection j i$ 置 -XX 
CMSFullGCsBeforeCompaction， 日 志 输 出 如 清单 7-20 所 示 。 


代码 清单 7-20 线程 100 个 时 使 用 CMS 收集 器 日 志 输出 
[GC [DefNew: 825K->149K(4928K), 0.0023384 secs][Tenured: 8704K->661K(10944K) ， 
0.0587725 secs] 9017K->661K(15872K), [Perm : 374K->374K(12288K)], 0.0612037 secs] 
(Times: user-0.01 sys-0.02, real=0.06 secs] 
Heap 
def new generation total 4992K, used 179K [0x27010000, 0x27570000, 0x2c560000) 
eden space 4480K, $ used [0x27010000, 0x2703cda8, 0x27470000) 
from space 512K, $ used [0x27470000, 0x27470000, 0x274£0000) 
to space 512K, 0% used [0x274f0000, 0x274f0000, 0x27570000) 
tenured generation total 10944K, used 8853K [0x2c560000, 0x2d010000, 0x37010000) 
the space 10944K, 80% used [0x2c560000, Ox2ce057c8, 0x2ce05800, 0x2d010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706db10, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw Space 12288K, 55$ used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


如 果 使 用 参数 -XX: +UseConcMarkSweepGC， 表 示 年 轻 代 使 用 并 
行 收集 器 ， 年 老 代 使 用 CMS。 和 输出 如 清单 7-21 所 示 。 


代码 清单 7-21 使 用 -XX:+UseConcMarkSweepGC 参数 
[GC [ParNew: 8967K->669K (14784K), 0.0040895 secs] 8967K->669K(63936K), 0.0043255 
secs] [Times: user-0.00 sys-0.00, real-0.00 secs] 
Heap 
par new generation total 14784K, used 9389K [0x03£50000, 0x04£50000, 0x04£50000) 
eden space 13184K, 66% used [0x03f50000, 0x047d3e58, 0x04c30000) 
from space 1600K, 41% used [0x04dc0000, 0x04e67738, 0x04f50000) 
to space 1600K, 0% used [0x04c30000, 0x04c30000, 0x04dc0000) 
concurrent mark-sweep generation total 49152K, used OK [0x04f50000, 0x07£50000, 
0x09£50000) 


concurrent-mark-sweep perm gen total 12288K, used 2060K [0x09f50000, 0x0ab50000, 
0x0d£50000) 


并 行 收 集 器 工作 时 的 线程 数量 可 以 使 用 -XX: ParallelGCThreads 2 
数 指定 。 一 般 ， 最 好 与 CPU 数 量 相 当 ， 避 免 过 多 的 线程 数 影响 垃圾 收 
集 性 能 。 在 默认 情况 下 ， 当 CPU 数量 小 于 8 个 ，ParallelGCThreads 的 值 
等 于 CPU 数量 ， 大 于 8 个 ParalelGCThreads 的 值 等 于 3+ 
[5*CPU_Count]l/8]。 设 置 为 8 个 线程 后 输出 如 清单 7-22 所 示 。 


代码 清单 -22 并 发 收集 器 的 线程 设置 8 个 时 日 志 输出 
[GC [ParNew: 8967K->676K (14784K) , 0.0036983 secs] 8967K-»676K(63936K) , 0.0037662 


secs] [Times: user-0.00 sys=0.00, real=0.00 secs] 


Heap 
par new generation total 14784K, used 9395K [0x040e0000, 0x050e0000, 0x050e0000) 
eden space 13184K, 66% used [0x040e0000, 0x04963e58, 0x04dc0000) 
from space 1600K, 42% used [0x04f£50000, 0x04ff9100, 0x050e0000) 
to space 1600K, $ used [0x04dc0000, 0x04dc0000, 0x04£50000) 
concurrent mark-sweep generation total 49152K, used OK [0x050e0000, 0x080e0000, 
0x0a0e0000) 
concurrent-mark-sweep perm gen total 12288K, used 2060K [0x0a0e0000, 0x0ace0000, 
0x0e0e0000) 


并 发 收集 器 的 线程 设置 128 个 时 日 志 输 出 
(GC [ParNew: 8967K->664K (14784K), 0.0207327 secs] 8967K->664K (63936K), 0.0208077 
secs] [Times: user=0.03 sys-0.00, real=0.02 secs] 
并 发 收集 器 的 线程 设置 640 个 时 日 志 输 出 


[GC [ParNew: 8967K->667K(14784K), 0.2323704 secs] 8967K-5667K(63936K) ，0.2324778 


secs] [Times: user-0.34 sys-0.02, real-0.23 secs] 


并 发 收集 器 的 线程 设置 1280 个 时 日 志 输 出 


Error occurred during initialization of VM 


Too small new size specified 


7.3.3.7 G1 收集 器 


G1 全 称 是 Garbage-First。The Garbage-First (G1) 垃圾 收集 器 完全 
支持 在 Oracle JDK 7 Update 4 和 以 后 的 版 本 。G1 收 集 器 是 一 个 服务 器 类 
型 的 垃圾 收集 器 ， 目 标 用 于 大 存储 器 的 多 处 理 器 机 器 。 它 符合 垃圾 收 
集 (GC) 以 很 高 的 概率 ， 暂 停 时 间 的 目标 ， 同 时 实现 高 吞吐 量 。 整 个 
堆 的 操作 ， 比 如 全 局 标记 ， 同 时 执行 的 应 用 程序 线程 。 这 可 以 防止 中 
断 堆 或 实时 数据 的 大 小 比例 。 

G1 收集 器 的 设计 初衷 是 为 了 替代 CMS 收 集 器 而 生 ， 自 身 的 目标 是 
以 更 高 的 计算 成 本 为 代价 最 小 化 STW 中 断 时 间 。G1 更 适合 于 低 延 迟 应 
用 程序 ， 如 Web 服 务 器 简单 来 说 ，G1 是 一 款 基 于 并 行 和 并 发 、 低 延迟 
以 及 暂停 时 间 更 加 可 控 的 区 域 化 分 代 式 垃圾 收集 器 。G1 在 内 存 空 间 的 
设计 上 重新 塑造 了 整个 Java 扒 区， 尽管 同样 也 是 基于 分 代 的 概念 执行 内 
存 分 配 和 垃圾 回收 ， 但 是 G1 却 并 没有 采用 传统 物理 隔离 的 新 生 代 和 老 
年 代 布 局 方式 ， 仪 仪 逻辑 上 划分 为 新 生 代 和 老年 代 ， 它 选择 的 将 Java 堆 
区 划分 成 2048 个 大 小 相同 的 独立 Region 块 ， 每 个 Region 块 之 间 可 能 是 不 
连续 的 ， 其 大 小 根据 堆 空 间 的 实际 大 小 而 定 ， 整 体 被 控制 在 1MB 到 
32MB 之 间 。 这 样 划 分 的 好 处 在 于 可 以 更 好 地 提升 GC 的 回收 频率 和 缩 
短 “Stop-the-World” 机 制 的 暂停 时 间 以 换取 更 大 的 程序 吞吐 量 ， 甚 至 能 
够 真正 地 精确 控制 程序 的 暂停 时 间 等 。 这 是 因为 G1 收集 器 在 执行 内 存 
回收 时 ， 会 优先 释放 掉 整 个 Java 堆 区 中 一 些 占用 内 存 较 大 的 Region 块 ， 
从 而 可 以 避免 像 以 往 一 样 直接 扫描 整个 Java 堆 区 (如 果 一 个 Region 块 中 
引用 另 一 个 Region 块 内 的 对 象 时 ， 则 通过 Remembered Set 技 术 避 免 全 堆 
扫描 ) 。 至 于 执行 内 存 回 收 时 “Stop-the-World” 机 制 的 暂停 时 间 更 加 可 
控 ， 是 相对 于 Parallel 收 集 器 而 言 ， 尽 管 Parallel 收 集 器 也 提供 选项 “- 
XX: MaxGCPauseMillis” 控 制程 序 的 暂停 时 间 ， 但 是 在 大 内 存 的 空间 释 
放 操 作 中 ， 和 暂停 时 间 其 实 并 非 是 完全 可 控 的 ， 只 能 说 尽 可 能 控制 在 预 
期 范围 内 ， 但 谁 也 无 法 保证 内 存 回 收 时 所 带 来 的 暂停 时 间 一 定 会 百 分 
百 地 控制 在 规定 的 时 间 阅 值 内 ， 所 以 一 定 会 有 些 误 差 。 而 由 于 G1 收 集 
器 并 非 全 堆 扫 描 ， 只 优先 回收 占用 内 存 较 大 的 一 些 Region 块 ， 所 以 G1 
收集 器 的 暂停 时 间 会 更 加 可 控 。 

前 面 说 过 ， 堆 被 划分 成 多 个 大 小 相等 的 堆 区 ， 每 一 个 连续 范围 的 
虚拟 内 存 。G1 执 行 并 行 全 局 标记 阶段 确定 堆 上 对 象 的 活跃 度 。 标 记 阶 
段 完成 后 ，G1 知 道 哪个 区 域 大 多 是 空 的 。 它 先 收集 在 这 些 区 域 ， 通 常 
会 产生 大 量 的 自由 空间 。 这 就 是 为 什么 这 种 垃圾 收集 方法 叫 作 G1 收集 


器 。 顾 名 思 义 ，G1 集 中 收集 和 压缩 活动 区 域 的 堆 ， 类 似 可 以 回收 的 对 
象 。G1 使 用 暂停 预测 模型 来 满足 用 户 定义 的 暂停 时 间 目 标 和 选择 一 些 
区 域 收 集 基于 指定 的 暂停 时 间 目 标 。 通 过 G1 作为 成 熟 的 回收 使 用 垃 专 
收集 疏散 区 域 。G1 的 副本 从 一 个 或 一 个 以 上 的 堆 区 对 象 单 一 区 域 堆 
上 ， 并 在 这 一 过 程 中 双方 的 契约 和 释放 内 存 。 总 之 就 是 多 处 理 器 ， 减 
少 暂 停 时 间 和 增加 吞吐 量 。 因 此 ， 每 个 垃圾 收集 ，G1 连 续 工 作 来 减少 
碎 片 ， 在 用 户 定 义 的 暂停 时 间 工 作 。 这 是 超越 的 以 往 方法 的 能 力 。 
CMS (并 发 标记 扫描 ) 垃圾 收集 不 进行 压缩 。parallelold 垃 圾 收集 仅 执 
行 整个 堆 压 缩 ， 从 而 导致 了 相当 的 暂停 时 间 。 我 们 需要 注意 ，G1 进 行 
的 收集 方式 属于 非 实 时 收集 ， 即 便 符合 所 有 的 回收 标准 ， 我 们 还 是 不 
能 百 分 百 地 确定 会 被 回收 。 根 据 统计 的 数据 显示 ，G1 也 会 事先 对 用 户 
的 制定 目标 时 间 内 的 收集 目标 进行 统计 ， 尽 量 多 地 回收 垃圾 。 因 此 ， 
具有 一 个 合理 准确 的 收集 区 域 的 成 本 模型 ， 并 使 用 该 模式 来 确定 哪 一 
个 多 少 区 域 要 收集 当 目 标 停留 的 暂停 时 间 内 。 

G1 收 集 器 的 执行 过 程 主要 可 以 划分 为 6 个 阶段 ， 即 初始 标记 

(Initial-Mark) 阶段 、 根 区 域 扫 描 (Root-Region-Scanning) 阶段 、 并 
发 标记 (Concument-Marking) 阶段 、 再 次 标记 (Remark) 阶段 、 清 除 
(Cleanup) 阶段 和 拷贝 (Copying) 阶段 。 

G1 收集 器 的 执行 过 程 与 CMS 收 集 器 相似 。 在 初始 标记 阶段 中 ， 程 
序 中 所 有 的 工作 线程 都 将 会 因为 “Stop-the-World” 机 制 而 出 现 短 暂 的 暂 
停 ， 该 阶段 的 主要 任务 是 标记 RootrRegion。 一 旦 标记 完成 之 后 就 会 恢 
复 之 前 被 暂停 的 所 有 应 用 线程 。 接 下 来 将 会 进入 到 根 区 域 扫 摘 阶段 ， 
该 阶段 的 主要 任务 是 扫描 Root-Region 中 引用 老年 代 的 一 些 Region 块 ， 
只 有 在 执行 完 扫 描 之 后 ， 才 能 开始 下 一 次 新 生 代 内 存 回 收 。 

并 发 标记 阶段 的 主要 任务 是 找 出 整个 Java 堆 区 中 的 存活 对 象 ， 由 于 
该 阶段 并 不 会 导致 程序 出 现 暂 停 ， 因 此 在 执行 的 过 程 中 允许 被 新 生 代 
内 存 回 收 打 断 。 再 次 标记 阶段 和 初始 标记 阶段 同样 都 是 基于 “Stop-the- 
World” 机 制 的 ， 该 阶段 的 主要 任务 就 是 完成 整个 堆 区 中 存活 对 象 的 标 
记 。 清 除 标记 阶段 由 三 部 分 组 成 ， 首 先 会 计算 出 所 有 的 活跃 对 象 并 完 
全 释放 一 些 自由 的 Region 块 ， 然 后 处 理 Remembered Set， 再 次 需要 注意 
的 是 ， 这 两 部 分 操作 将 会 暂停 程序 中 的 应 用 线程 ， 然 后 并 发 重 置 空 内 
的 一 些 Region 块 ， 并 将 它们 放 回 至 空 朵 列表 中 。 最 后 的 拷贝 阶段 也 是 
基于 “Stop-the-World” 机 制 的 ， 该 阶段 的 主要 任务 就 是 将 存活 对 象 复制 


到 未 使 用 过 的 Region 块 中 。 当 经 历 过 这 6 个 阶段 后 ，G1 收 集 器 的 内 存 回 
收 任务 就 算是 完成 了 。 在 程序 开发 过 程 中 ， 程 序 员 可 以 通过 选项 “- 
XX: UseG1GC” 来 手动 指定 使 用 G1 收集 器 执行 内 存 回收 任务 。 

由 于 G1 主 要 关注 于 多 CPU 多 线程 ， 所 以 内 存 分 配 采 用 thread-local 
allocation buffers (TLABs) 技术 。 每 个 分 配 线程 都 有 一 个 自己 的 buffers 
用 来 分 配对 象 ， 当 buffers 用 完 或 者 不 够 的 时 候 ， 去 重新 申请 一 块 内 存放 
在 自己 的 thread-local 里 面 。 这 样 对 象 的 内 存 分 配 被 最 小 化 到 私有 的 
buffers 里 面 ， 缓 解 了 并 发 分 配 内 存 的 讨 力 。 

当 region 被 填 满 后 ， 分 配 内 存 的 线程 会 重新 选择 一 个 新 的 regiono 
空 region 被 组 织 到 一 个 linked list 里 面 ， 这 样 可 以 快速 找到 新 的 region。 

对 于 大 对 象 的 分 配 不 是 在 TLABs 进 行 的 ， 而 是 在 TLABs 之 外 。 当 
一 个 对 象 的 大 小 超过 region 的 3/4 的 时 候 ， 这 个 对 象 被 认为 是 巨大 的 

(humongous) 。 巨 大 的 对 象 被 分 配 到 特殊 的 区 域 (heap regions) o XX 
些 区 域 只 包含 巨大 对 象 (humongous object) 。 

G1 收集 器 的 目标 是 作为 一 款 服 务 器 的 垃圾 收集 器 ， 因 此 ， 它 在 否 
吐 量 和 停顿 控制 上 ， 预 期 要 优 于 CMS 收 集 器 。 

与 CMS 收 集 器 相 比 ，G1 收 集 器 是 基于 标记 -压缩 算法 的 。 因 此 , v 
会 产生 空间 碎片 ， 也 没有 必要 在 收集 完成 后 ， 进 行 一 次 独占 式 的 碎 
片 整 理工 作 。G1 收 集 器 还 可 以 进行 非常 精确 的 停顿 控制 。 它 可 以 让 开 
发 人 员 指 定 在 长 度 为 M 的 时 间 段 中 ， 垃 圾 回收 时 间 不 超过 N。 使 用 参 
数 -XX: +UnlockExperimentalVMOptions -XX: +UseG1GC 来 启用 G1 回 
收 器 ， 设 置 G1 回 收 器 的 目标 停顿 时 间 : -XX: MaxGCPauseMills=20，- 
XX: GCPauseIntervalMills=200. 

总 体 来 说 ，G1 跟 CMS 一 样 ， 是 一 块 低 延 时 的 收集 器 ， 同 样 牺 牲 了 


(1) DR: CMS 中 ， 堆 被 分 为 PermGen，YoungGen，OldGen; 而 
YoungGen 又 分 了 两 个 survivo 区 域 。 在 G1 中 ， 堆 被 平均 分 成 几 个 区 域 
(region) ， 在 每 个 区 域 中 ， 虽然 也 保留 了 新 老 代 的 概念 ， 但 是 收集 器 
是 以 整个 区 域 为 单位 收集 的 。 

(2) 算法 : 相对 于 CMS 的 “标记 一 清理 ”算法 ，G1 会 使 用 压缩 算 
法 ， 保 证 不 产生 多 余 的 碎片 。 收 集 阶 段 ，G1 会 将 某 个 区 域 存 活 的 对 象 


拷贝 的 其 他 区 域 ， 然 后 将 整个 区 域 回收 。 

(3) 停顿 时 间 可 控 : 为 了 缩短 停顿 时 间 ，G1 建 立 可 预存 停顿 模 
型 ， 这 样 在 用 户 设置 的 停顿 时 间 范 围 内 ，G1 会 选择 适当 的 区 域 进行 收 
集 ， 确 保 停顿 时 间 不 超过 用 户 指定 时 间 。 

7.3.3.8 收集 器 对 系统 性 能 的 影响 

上 面 说 了 这 么 多 关于 各 个 垃圾 收集 器 的 理论 、 参 数 、 优 缺点 ， 我 
P M D 让 我 们 来 看 看 不 同 的 
效果 。 

示例 程序 中 通过 对 7-23 所 示 的 代码 运行 1 万 次 循环 ， 每 次 分 配 
512*100B 空 间 ， 采 用 不 同 的 垃圾 回收 器 ， 输 出 程序 运行 所 消耗 的 时 
间 。 


代码 清单 7-23 示例 程序 代码 


import java.util.HashMap; 


public class GCTimeTest { 
static HashMap map = new HashMap(); 


public static void main(String[] args) { 
long begintime = System.currentTimeMillis(); 
for(int i-0;1«10000; i*4)( 
if (map.size()*512/1024/1024»-400) { 
map. clear() ;// 保 护 内 存 不 溢出 
System.out.println ("clean map"); 
} 
byte[] bl; 
for(int j20;3«100; j++) { 
bl = new byte[512]; 
map.put (System.nanoTime(), b1); //R HAF 


} 
long endtime = System.currentTimeMillis(); 


System. out.println (endtime-begintime) ; 


} 


使 用 参数 -Xmx512M-Xms512M-XX: +UseParNewGC 运 行 代码 ， 输 
出 如 清单 7-24 所 示 。 


代码 清单 7-24 使 用 ParNewGC 收集 器 运行 日 志 
clean map 8565 


cost time=1655 


使 用 参数 -Xmx512M-Xms512M-XX : +UseParallelOldGC -XX : 
ParallelGCThreads=8 运 行 代 码 ， 输 出 如 清单 7-25 所 示 。 


代码 清单 7-25 使 用 ParallelOld 收集 器 运行 日 志 
clean map 8798 


cost time-1998 


使 用 参数 -Xmx512M-Xms512M-XX: +UseSerialGC 运 行 代码 i$ 
出 如 清单 7-26 所 示 。 


代码 清单 7-26 使 用 Serial 收集 器 运行 日 志 
clean map 8864 
cost time=1717 


使 用 参数 -Xmx512M-Xms512M-XX: +UseConcMarkSweepGC 运 行 
代码 ， 输 出 如 清单 7-27 所 示 。 


代码 清单 7-27 使 用 CMS 收集 器 运行 日 志 
clean map 8862 
cost time-1530 


根据 Oracle 公 司 官 方针 对 Java9 的 通报 ，G1 将 取代 并 行 垃 圾 收集 器 
成 为 服务 器 配置 的 默认 选项 。 正 如 Oracle 在 内 存 管 理 白皮书 中 描述 的 那 
样 ， 并 行 垃圾 收集 器 的 设计 初衷 ， 是 通过 不 常 发 生 (但 可 能 时 间 比 较 
K) 的 Stop-The-World (STW) 中 断 最 大 化 应 用 程序 吞吐 量 。 并 行 垃圾 
收集 器 将 消耗 的 总 计算 时 间 最 小 化 ， 长 远 来 看 ， 其 破坏 性 更 小 ， 因 此 
可 以 提供 更 好 的 整体 性 能 。 该 收集 器 非常 适合 对 响应 时 间 要 求 不 高 的 
应 用 程序 ， 比 如 批 处 理 。 


7.4 实用 JVM 实 验 


由 于 Java 字 节 码 是 运行 在 JVM 虚 拟 机 上 的 ， 同 样 的 字 节 码 使 用 不 同 
的 JVM 虚 拟 机 参数 运行 ， 其 性 能 表现 可 能 各 不 一 样 。 为 了 能 使 系统 性 


能 最 优 ， 就 需要 选择 使 用 合适 的 JVM 人 参数 运行 Java 应 用 程序 ， 我 们 本 节 
就 针对 不 同 的 JVM 参 数 进行 实验 讲解 。 


7.4.1 将 新 对 象 预 留 在 年 轻 代 


由 于 Full GC 的 成 本 远 远 高 于 Minor GC， 因 此 尽 可 能 将 对 象 分 配 在 
年 轻 代 是 一 项 明智 的 做 法 。 虽 然 在 大 部 分 情况 下 ，JVM 会 尝试 在 eden 
区 分 配对 象 ， 但 是 由 于 空间 紧张 等 问题 ， 很 可 能 不 得 不 将 部 分 年 轻 对 
象 提前 向 年 老 代 压缩 。 因 此 ， 在 JVM 参 数 调 优 时 可 以 为 应 用 程序 分 配 
一 个 合理 的 年 轻 代 空间 ， 以 最 大 限度 避免 新 对 象 直接 进入 年 老 代 的 情 
况 发 生 。 

代码 清单 7-28 所 示 代 码 分 配 了 4MB 内 存 空间 ， 观 察 一 下 它 的 内 存 
使 用 情况 。 


代码 清单 7-28 示例 程序 代码 
public class PutInEden { 
public static void main(String[] args) { 

byte[] b1,b2,b3,b4; // £X $ € 
bl=new byte[1024*1024]; // 分 配 1MB 推 空间 ， 考 察 堆 空间 的 使 用 情况 
b2=new byte[1024*1024]; 
b3=new byte[1024*1024]; 
b4-new byte[1024*1024]; 


} 


使 用 JVM 参 数 -XX: +PrintGCDetails-Xmx20M-Xms20M 运 行 上 例 ， 
输出 如 清单 7-29 所 示 : 


代码 清单 7-29 示例 程序 代码 运行 输出 

[GC [DefNew: 5504K->640K (6144K), 0.0114236 secs] 5504K->5352K(19840K), 0.0114595 
secs] [Times: user=0.02 sys=0.00, real=0.02 secs] 

[GC [De£New: 6144K->640K (6144K), 0.0131261 secs] 10856K->10782K (19840K) , 0.0131612 
secs] [Times: user=0.02 sys=0.00, real-0.02 secs] 

[GC [DefNew: 6144K-»6144K (6144K), 0.0000170 secs] [Tenured: 10142K->13695K (13696K), 
0.1069249 secs] 16286K->15966K(19840K), [Perm : 376K->376K(12288K)], 0.1070058 secs] 
[Times: user-0.03 sys=0.00, real=0.11 secs] 

[Full GC [Tenured: 13695K-513695K(13696K), 0.0302067 secs] 19839K-519595K(19840K), 
[Perm : 376K->376K (12288K)], 0.0302635 secs] [Times: user-0.03 sys=0.00, real-0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K) , 0.0311986 secs] 19839K->19839K(19840K), 
[Perm : 376K->376K (12288K) ], 0.0312515 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K) , 0.0358821 secs] 19839K->19825K(19840K), 
[Perm : 376K->371K (12288K) ], 0.0359315 secs] [Times: user=0.05 sys=0.00, real=0.05 secs] 

[Full GC [Tenured: 13695K->13695K (13696K), 0.0283080 secs] 19839K->19839K(19840K), 
[Perm: 371K->371K (12288K) ], 0.0283723 secs] [Times: user-0.02 sys=0.00, real=0.01 secs] 

[Full GC [Tenured: 13695K->13695K (13696K), 0.0284469 secs] 19839K->19839K(19840K), 
[Perm : 371K->371K(12288K) ], 0.0284990 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K), 0.0283005 secs] 19839K->19839K(19840K), 
[Perm : 371K->371K(12288K) ], 0.0283475 secs] [Times: user=0.03 sys=0.00, real-0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K) , 0.0287757 secs] 19839K->19839K (19840K) , 
[Perm : 371K->371K(12288K) ], 0.0288294 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K), 0.0288219 secs] 19839K->19839K (19840K), 
[Perm : 371K->371K (12288K) ], 0.0288709 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K) , 0.0293071 secs] 19B39K->19839K(19840K), 
[Perm : 371K->371K (12288K)], 0.0293607 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 13695K->13695K (13696K), 0.0356141 secs] 19839K->19838K(19840K), 
[Perm : 371K->371K(12288K) ], 0.0356654 secs] [Times: user=0.01 sys=0.00, real=0.03 secs] 

Heap 

def new generation total 6144K, used 6143K [0x35c10000, 0x362b0000, 0x362500000) 

eden space 5504K, 100% used [0x35c10000, 0x36170000, 0x36170000) 
from space 640K, 99% used [0x36170000, 0x3620fc80, 0x36210000) 
to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000) 

tenured generation total 13696K, used 13695K [0x362b0000, 0x37010000, 
0x37010000) 

the space 13696K, 99% used [0x362b0000, 0x3700f£ff8, 0x37010000, 0x37010000) 
compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706cd20, 0x3706ce00, 0x37c10000) 
ro space 10240K, 51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


上 面 的 输出 显示 年 轻 代 eden 的 大 小 有 5MB 左 右 。 分 配 足 够 大 的 年 
轻 代 空间 ， 使 用 jvm 参 数 -XX: +PrintGCDetails-Xmx20M-Xms20M- 
Xmn6M 运 行 上 例 ， 输 出 如 7-30 所 示 。 


代码 清单 -30 示例 程序 代码 运行 输出 

[GC [DefNew: 4992K->576K(5568K), 0.0116036 secs] 4992K->4829K(19904K), 0.0116439 
secs] [Times: user-0.02 sys-0.00, real-0.02 secs] 

[GC [DefNew: 5568K->576K (5568K), 0.0130929 secs] 9821K-59653K(19904K) , 0.0131336 


secs] [Times: user=0,02 sys=0.00, real=0.02 secs] 

[GC [DefNew: 5568K->575K (5568K), 0.0154148 secs] 14645K->14500K (19904K) , 0.0154531 
secs] [Times: user-0.00 sys-0.01, real-0.01 secs] 

[GC [DefNew: 5567K->5567K (5568K), 0.0000197 secs] [Tenured: 13924K->14335K (14336K) , 
0.0330724 secs] 19492K->19265K(19904K), [Perm : 376K->376K(12288K)], 0.0331624 secs] 
[Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 14335K->14335K (14336K) , 0.0292459 secs] 19903K->19902K (19904K) , 
[Perm ; 376K->376K (12288K) ], 0.0293000 secs] [Times: user-0.03 sys-0.00, real=0.03 secs] 

[Full GC [Tenured: 14335K->14335K (14336K) , 0.0278675 secs] 19903K->19903K (19904K) , 
[Perm : 376K-»376K (12288K) ], 0.0279215 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured: 14335K->14335K (14336K) , 0.0348408 secs] 19903K->19889K (19904K) , 
[Perm : 376K->371K (12288K) ], 0.0348945 secs] [Times: user=0.05 sys=0.00, real=0.05 secs] 

{Full GC [Tenured: 14335K->14335K (14336K), 0.0299813 secs] 19903K->19903K (19904K) , 
(Perm: 371K->371K (12288K) ], 0.0300349 secs] [Times: user=0.01 sys-0.00, real=0.02 secs] 

[Full GC [Tenured: 14335K->14335K (14336K) , 0.0298178 secs] 19903K->19903K (19904K), 
[Perm : 371K->371K(12288K) ], 0.0298688 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space[Full GC 
[Tenured: 14335K->14335K(14336K), 0.0294953 secs] 19903K->19903K(19904K), [Perm : 
371K->371K(12288K)], 0.0295474 secs] [Times: user=0.03 sys-0.00, real=0.03 secs] 

[Full GC [Tenured 

14335K->14335K (14336K), 0.0287742 secs] 19903K->19903K(19904K), [Perm 
371K->371K (12288K)], 0.0288239 secs] [Times: user=0.03 sys=0.00, real=0.03 secs] 

[Full GC [Tenured at GCTimeTest.main(GCTimeTest.java:16) 

14335K->14335K (14336K), 0.0287102 secs] 19903K->19903K(19904K), [Perm 
371K->371K (12288K)], 0.0287627 secs] [Times: user=0.03 sys=0.00, real-0.03 secs] 

Heap 

def new generation total 5568K, used 5567K [0x35c10000, 0x36210000, 0x36210000) 

eden space 4992K, 100% used [0x35c10000, 0x360£0000, 0x360£0000) 
from space 576K, 99% used [0x36180000, 0x3620ffe8, 0x36210000) 
to space 576K, 0% used [0x360f0000, 0x360£0000, 0x36180000) 

tenured generation total 14336K, used 14335K [0x36210000, 0x37010000, 
0x37010000) 

the space 14336K, 99% used [0x36210000, 0x3700ffd8, 0x37010000, 0x37010000) 
compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706ce28, 0x3706d000, 0x37c10000) 
ro space 10240K, 51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3bal10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


通过 设置 一 个 较 大 的 年 轻 代 预 留 新 对 象 ， 设 置 合理 的 survivor 区 并 
且 提 供 survivor 区 的 使 用 率 ， 可 以 将 年 轻 对 象 保存 在 年 轻 代 。 一 般 来 
说 ，survivor 区 的 空间 不 够 ,或 者 占用 量 达 到 50% 时 ， 就 会 将 对 象 进入 
FER (不管 它 的 年 龄 有 多 大 ) 。 代 码 清单 7-31 所 示 的 程序 中 我 们 尝试 
让 对 象 b3 可 以 被 回收 。 


代码 清单 7-31 示例 程序 代码 
public class PutInEden2 { 
public static void main(String[] args) { 
byte[] b1,b2,b3; 


bl=new byte [1024*512];// 分 配 0. 5MB 推 空间 
b2-new byte[1024*1024*4] ;// 分 配 4MB 推 空间 
b3-new byte[1024*1024*4] ; 

b3=null; // 使 b3 可 以 被 回收 
b3-new byte[1024*1024*4];// 分 配 4MB 堆 空间 


} 


使 用 参数 -XX: +PrintGCDetails-Xmx1000M-Xms500M-Xmn100M- 
XX: SurvivorRatio=8 运 行 上 例 ， 输 出 如 清单 7-32 所 示 。 


代码 清单 7-32 示例 程序 代码 运行 输出 
Heap 
def newgeneration total 92160K, used 11878K [0x0£010000, 0x15410000, 0x15410000) 
eden space 81920K, $ used [0x0£010000, 0x0f1a9a20, 0x14010000) 
from space 10240K, 99$ used [0x14a10000, 0x1540fff8, 0x15410000) 
to space 10240K, $ used [0x14010000, 0x14010000, 0x14a10000) 
tenured generation total 409600K, used 86434K [0x15410000, 0x2e410000, 
0x4d810000) 
the space 409600K, 21% used [0x15410000, 0x1a878b18, 0x1a878c00, 0x2e410000) 
compacting perm gen total 12288K, used 2062K [0x4d810000, 0x4e410000, 0x51810000) 


the space 12288K, 16% used [0x4d810000, 0x4dal3b18, 0x4dal3c00, 0x4e410000) 
No shared spaces configured. 


年 轻 代 分 配 了 8M， 年 老 代 也 分 配 了 8M。 加 上 -XX : 
TargetSurvivorRatio=90 参 数 后 ， 可 以 提高 from 区 的 利用 率 ， 使 fom 区 使 
用 到 90% 时 ， 再 将 对 象 送 入 年 老 代 ， 输 出 如 清单 7-33 所 示 。 


代码 清单 7-33 “示例 程序 代码 运行 输出 
Heap 
def new generation total 9216K, used 9215K [0x35c10000, 0x36610000, 0x36610000) 
eden space 8192K, 100% used [0x35c10000, 0x36410000, 0x36410000) 
from space 1024K, 99% used [0x36510000, 0x3660fc50, 0x36610000) 
to space 1024K, 0% used [0x36410000, 0x36410000, 0x36510000) 
tenured generation total 10240K, used 10239K [0x36610000, 0x37010000, 
0x37010000) 
the space 10240K, 99% used [0x36610000, 0x3700f£70, 0x37010000, 0x37010000) 
compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3% used [0x37010000, 0x3706cd90, 0x3706ce00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


将 SurvivorRatio 设 置 为 2， 将 B1 对 象 预 存在 年 轻 代 。 输 出 如 清单 7- 
34 所 示 。 


代码 清单 7-34 示例 程序 代码 
Heap 
def new generation total 7680K, used 7679K [0x35c10000, 0x36610000, 0x36610000) 
eden space 5120K, 100$ used [0x35c10000, 0x36110000, 0x36110000) 
from space 2560K, 99% used [0x36110000, 0x3638fff0, 0x36390000) 


to space 2560K, 0$ used [0x36390000, 0x36390000, 0x36610000) 
tenured generation total 10240K, used 10239K [0x36610000, 0x37010000, 
0x37010000) 
the space 10240K, 99$ used [0x36610000, 0x3700fff0, 0x37010000, 0x37010000) 
compacting perm gen total 12288K, used 371K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706ce28, 0x3706d000, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


7.4.2 大 对 象 进 入 年 老 代 


在 大 部 分 情况 下 ， 将 对 象 分 配 在 年 轻 代 是 合理 的 。 但 是 ， 对 于 大 
对 象 ， 因 为 大 对 象 出 现在 年 轻 代 很 可 能 扰乱 年 轻 代 GC， 并 破坏 年 轻 代 
原 有 的 对 象 结 构 。 因 为 尝试 在 年 轻 代 分 配 大 对 象 ， 很 可 能 导致 空间 不 
足 ， 为 了 有 足够 的 空间 容纳 大 对 象 ，JVM 不 得 不 将 年 轻 代 中 的 年 轻 对 
象 挪 到 年 老 代 。 因 为 大 对 象 占 用 空间 多 ， 所 以 可 能 需要 移动 大 量 小 的 
年 轻 对 象 进入 年 老 代 ， 这 对 GC 相当 不 利 。 

基于 以 上 原因 ， 可 以 将 大 对 象 直接 分 配 到 年 老 代 ， 保 持 年 轻 代 对 
象 结 构 的 完整 性 ， 这 样 可 以 提高 GC 的 效率 。 如 果 一 个 大 对 象 同时 又 是 
一 个 短命 的 对 象 ， 假 设 这 种 情况 出 现 很 频繁 ， 那 对 于 GC 来 说 会 是 一 
灾难 。 原 本 应 该 用 于 存放 永久 对 象 的 年 老 代 ， 被 短命 的 对 象 塞 满 ， 这 

意味 着 对 堆 空 间 进行 了 洗 牌 ， 扰 乱 了 分 代 内 存 回收 的 基本 思路 。 
此 ， 在 软件 开发 过 程 中 ， 应 该 尽 可 能 避免 使 用 短命 的 大 对 象 。 


可 以 使 用 参数 -XX: PetenureSizeThreshold 设 置 大 对 象 直接 进入 年 
老 代 的 阅 值 。 当 对 象 的 大 小 超过 这 个 值 时 ， 将 直接 在 年 老 代 分 配 。 参 
数 -XX: PetenureSizeThreshold 只 对 串 行 收 集 器 和 年 轻 代 并 行 收集 器 有 
效 ， 并 行 回收 收集 器 不 识别 这 个 参数 。 


代码 清单 7-35  PetenureSizeThreshold 参数 示例 程序 代码 
public class BigObj20ld 1 
public static void main(String[] args) { 
byte[] b; 
b = new byte [1024*1024];// 分 配 一 个 1MB 的 对 象 


} 


使 用 JVM 参 数 -XX: +PrintGCDetails -Xmx20M -Xms20MB 运 行 ， 
可 以 得 到 清单 7-36 所 示 输 出 。 


代码 清单 7-36 示例 程序 代码 运行 输出 

Heap 

def new generation total 6144K, used 1378K [0x35c10000, 0x362b0000, 0x362b0000) 
eden space 5504K, 25% used [0x35c10000, 0x35d689e8, 0x36170000) 
from space 640K, 0% used [0x36170000, 0x36170000, 0x36210000) 
to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000) 

tenured generation total 13696K, used OK [0x362b0000, 0x37010000, 0x37010000) 
the space 13696K, 0% used [0x362b0000, 0x362b0000, 0x362b0200, 0x37010000) 

compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706dac8, 0x3706dc00, 0x37c10000) 


ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3bal10000) 
rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


可 以 看 到 该 对 象 被 分 配 在 了 年 轻 代 ， 占 用 了 25% 的 空间 。 如 果 需 
将 1MB 以 上 的 对 和 象 直 接 在 年 老 代 人 分配， 设置 -XX : 
PetenureSizeThreshold=1000000， 程 序 输出 如 清单 7-37 所 示 。 


代码 清单 7-37 示例 程序 代码 运行 输出 
Heap 
def new generation total 6144K, used 354K [0x35c10000, 0x362b0000, 0x362b0000) 
eden space 5504K, $ used [0x35c10000, 0x35c689d8, 0x36170000) 
from space 640K, 0$ used [0x36170000, 0x36170000, 0x36210000) 
to space 640K, 0% used [0x36210000, 0x36210000, 0x362b0000 
tenured generation total 13696K, used 1024K [0x362b0000, 0x37010000, 0x37010000) 
the space 13696K, 7% used [0x362b0000, 0x363b0010, 0x363b0200, 0x37010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3% used [0x37010000, 0x3706dac8, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 


rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


从 上 面 的 输出 中 ， 我 们 可 以 看 到 当 满 1IMB 时 进入 到 了 年 老 代 。 
7.4.3 设置 对 象 进入 年 老 代 的 年 龄 


堆 中 的 每 一 个 对 象 都 有 自己 的 年 龄 。 一 般 情 况 下 ， 年 轻 对 象 存放 
在 年 轻 代 ， 年 老 对 象 存放 在 年 老 代 。 为 了 做 到 这 点 ， 虚 拟 机 为 每 个 对 
象 都 维护 一 个 年 龄 。 

MRT Redek, 4 peu 则 被 移动 到 survivor 区 
中 ， 对 象 年 龄 加 1。 以 后 ， 对 象 每 经 过 一 次 GC 依 然 活 的 ， 则 年 龄 再 加 
1。 当 对 铺 年 龄 达到 阅 值 时 ， oe T 成 为 老年 对 象 。 

这 个 阅 值 的 最 大 值 可 以 通过 参数 -XX: MaxTenuringThreshold 来 设 
置 ， 默 认 值 是 15。 虽 然 -XX: MaxTenuringThreshold 的 值 可 能 是 15 或 者 
更 大 ， 但 这 不 意味 着 新 对 象 非 要 达到 这 个 年 龄 才能 进入 年 老 代 。 事 实 
上 ， 对 象 实际 进入 年 老 代 的 年 龄 是 虚拟 机 在 运行 时 根据 内 存 使 用 情 ; 
动态 计算 的 ， 这 个 参数 指定 的 是 阅 值 年 龄 的 最 大 值 。 即 ， 实 际 晋 升 年 
老 代 年 龄 等 于 动态 计算 所 得 的 年 龄 与 -XX: MaxTenuringThreshold 中 较 
小 的 那个 。 示 例 代码 如 代码 清单 7-38 所 示 。 


代码 清单 7-38 示例 程序 代码 
public class MaxTenuringThreshold { 
public static void main(String args[])| 

byte[] b1,b2,b3; 
bl = new byte[1024*512]; 
b2 = new byte[1024*1024*2]; 
b3 = new byte[1024*1024*4]; 
b3 = null; 
b3 = new byte[1024*1024*4]; 


人 参数 设置 为 : -XX: +PrintGCDetails-Xmx20M-Xms20M-Xmn10M- 
XX: SurvivorRatio=2 


运行 输出 如 清单 7-39 所 示 。 


代码 清单 7-39 示例 程序 代码 运行 输出 
[GC [DefNew: 2986K->690K (7680K), 0.0246816 secs] 2986K->2738K(17920K), 0.0247226 
secs] [Times: user-0.00 sys-0.02, real=0.03 secs] 
[GC [DefNew: 4786K->690K (7680K), 0.0016073 secs] 6834K->2738K(17920K), 0.0016436 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap 
def new generation total 7680K, used 4888K [0x35c10000, 0x36610000, 0x36610000) 
eden space 5120K, 82% used [0x35c10000, 0x36029a18, 0x36110000) 
from space 2560K, 26% used [0x36110000, 0x361bc950, 0x36390000) 
to space 2560K, 0$ used [0x36390000, 0x36390000, 0x36610000) 
tenured generation total 10240K, used 2048K [0x36610000, 0x37010000, 0x37010000) 
the space 10240K, 20% used [0x36610000, 0x36810010, 0x36810200, 0x37010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706db50, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3bal10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


更 改 参 数 为 : -XX: +PrintGCDetails-Xmx20M-Xms20M-Xmn10M- 
XX: SurvivorRatio=2-XX: MaxTenuringThreshold=1， 运 行 输 出 如 清单 
7-40 所 示 。 


代码 清单 7-40 示例 程序 代码 运行 输出 
[GC [DefNew: 2986K->690K (7680K), 0.0047778 secs] 2986K->2738K(17920K), 0.0048161 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew: 4888K->0K(7680K), 0.0016271 secs] 6936K->2738K(17920K), 0.0016630 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
Heap 
def new generation total 7680K, used 4198K [0x35c10000, 0x36610000, 0x36610000) 
eden space 5120K, 82% used [0x35c10000, 0x36029a18, 0x36110000) 
from space 2560K, 0% used [0x36110000, 0x36110088, 0x36390000) 
to space 2560K, 0$ used [0x36390000, 0x36390000, 0x36610000) 
tenured generation total 10240K, used 2738K [0x36610000, 0x37010000, 0x37010000) 
the space 10240K, 26% used [0x36610000, 0x368bc890, 0x368bca00, 0x37010000) 
compacting perm gen total 12288K, used 374K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3$ used [0x37010000, 0x3706db50, 0x3706dc00, 0x37c10000) 
ro space 10240K, 51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


上 面 加 粗 的 字体 显示 ， 第 一 次 运行 时 b1 对 象 在 程序 结束 后 依然 你 
存在 年 轻 代 。 第 二 次 运行 前 ， 我 们 减 小 了 对 象 晋升 年 老 代 的 年 龄 ， 设 
置 为 1。 即 ， 所 有 经 过 一 次 GC 的 对 象 都 可 以 直接 进入 年 老 代 。 程 序 运 
行 后 ， 可 以 发 现 b1 对 象 已 经 被 分 配 到 年 老 代 。 如 果 希 望 对 象 尽 可 能 长 
时 间 地 停留 在 年 轻 代 ， 可 以 设置 一 个 较 大 的 阅 值 。 


7.4.4 稳定 与 震荡 的 堆 大 小 


一 般 来 说 ， 稳 定 的 堆 大 小 是 对 垃圾 回收 有 利 的 。 获 得 一 个 稳定 的 
堆 大 小 的 方法 是 使 -Xms 和 -Xmx 的 大 小 一 致 ， 即 最 大 堆 和 最 小 堆 (初始 
堆 ) 一 样 。 如 果 这 样 设置 ， 系 统 在 运行 时 堆 大 小 理论 上 是 恒定 的 ， 稳 
定 的 扒 空 间 可 以 减少 GC 的 次 效 。 因 此 ， 很 多 服务 端 应 用 都 会 将 最 大 小 
和 最 小 堆 设 置 为 相同 的 数值 。 

但 是 ， 一 个 不 稳定 的 堆 并 非 写 无 用 处 。 稳 定 的 堆 大 小 虽然 可 以 减 
少 GC 次 数 ， 但 同时 也 增加 了 每 次 GC 的 时 间 。 让 堆 大 小 在 一 个 区 间 中 震 
沪 ， 在 系统 不 需要 使 用 大 内 存 时 ， 压 缩 堆 空间 ， 使 GC 应 对 一 个 较 小 的 


堆 ， 可 以 加 快 单 次 GC 的 速度 。 基 于 这 样 的 考虑 ，JVM 还 提供 了 两 个 参 
效用 于 压缩 和 扩展 堆 空间 。 


-XX: MinHeapFreeRatio 参 数 用 来 设置 堆 空间 最 小 空 内 比例， 默认 
值 是 40。 当 堆 空 间 的 空闲 内 存 小 于 这 个 数值 时 ，JVM 便 会 扩展 堆 空 
间 。 

-XX: MaxHeapFreeRatio 参 数 用 来 设置 堆 空 间 最 大 空 闪 比例 ， 默 认 
值 是 70。 当 堆 空 间 的 空 几 内存 大 于 这 个 数值 时 ， 便 会 压缩 堆 空 间 ， 得 
到 一 个 较 小 的 堆 。 

当 -Xmx 和 -Xms 相 等 时 ，-XX : MinHeapFreeRatio 和 -XX : 
MaxHeapFreeRatio 两 个 参数 无 效 。 


代码 清单 7-41 示例 程序 代码 


import java.util.Vector; 


public class HeapSize | 


public static void main(String args[]) throws InterruptedException{ 


Vector v = new Vector(); 


while (true) { 
byte[] b = new byte[1024*1024]; 
v.add(b) ; 
if(v.size() == 10){ 


v = new Vector(); 
} 
Thread. sleep (1); 


} 


上 述 代码 测试 -XX: MinHeapFreeRatio 和 -XX: MaxHeapFreeRatio 
的 作用 ， 设 置 运行 参数 为 -XX: -PrintGCDetails-Xms10M-Xmx40M- 
XX: MinHeapFreeRatio-40-XX : MaxHeapFreeRatio=50 时 ， 输 出 如 清 
单 7-42 所 示 。 


代码 清单 7-42 示例 程序 代码 运行 输出 

[GC [DefNew: 2418K->178K (3072K), 0.0034827 secs] 2418K->2226K (9920K), 0.0035249 
secs] [Times: user-0.00 sys-0.00, real-0.03 secs] 

[GC [DefNew: 2312K->0K (3072K), 0.0028263 secs] 4360K->4274K (9920K), 0.0029905 secs] 
(Times: user=0.00 sys-0.00, real=0.03 secs] 

[GC [DefNew: 2068K->0K (3072K), 0.0024363 secs] 6342K->6322K (9920K), 0.0024836 secs] 


[Times: user-0.00 sys=0.00, real-0.03 secs] 


[GC [DefNew: 2061K->0K(3072K), 0.0017376 secs][Tenured: 8370K->8370K (8904K), 
0.1392692 secs] 8384K->8370K(11976K), [Perm : 374K->374K(12288K)], 0.1411363 secs] 
[Times: user=0.00 sys=0.02, real=0.16 secs] 

[GC [DefNew: 5138K->0K (6336K), 0.0038237 secs] 13508K->13490K(20288K), 0.0038632 


secs] [Times: user-0.00 sys-0.00, real-0.03 secs] 


改 用 参数 : -XX PrintGCDetails-Xms40M-Xmx40M-XX : 
MinHeapFreeRatio=40-XX: MaxHeapFreeRatio=50， 运 行 输出 如 清单 7- 
43 所 示 。 


代码 清单 7-43 示例 程序 代码 运行 输出 

[GC [De£New: 10678K->178K (12288K) , 0.0019448 secs] 10678K->178K (39616K), 0.0019851 
secs] [Times: user-0.00 sys=0.00, real=0.03 secs] 
[GC [DefNew: 10751K->178K (12288K) , 0.0010295 secs] 10751K->178K (39616K) , 0.0010697 
secs] [Times: user=0.00 sys=0.00, real=0.02 secs] 
[DefNew: 10493K->178K (12288K) , 0.0008301 secs] 10493K->178K (39616K) , 0.0008672 
secs] [Times: user=0.00 sys-0.00, real=0.02 secs] 
[DefNew: 10467K->178K (12288K) , 0.0008522 secs] 10467K->178K (39616K) , 0.0008905 
secs] [Times: user=0.00 sys-0.00, real-0.02 secs] 
[DefNew: 10450K->178K (12288K) , 0.0008964 secs] 10450K->178K (39616K) , 0.0009339 
secs] [Times: user=0.00 sys-0.00, real=0.01 secs] 
[GC [DefNew: 10439K->178K (12288K) , 0.0009876 secs] 10439K->178K (39616K) , 0.0010279 


secs] [Times: user=0.00 sys=0.00, real-0.02 secs] 
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此 时 扒 空 间 的 垃圾 回收 稳定 在 一 个 固定 的 范围 。 在 一 个 稳定 的 堆 
中 ， 堆 空间 大 小 始终 不 变 ， 每 次 GC 时 ， 都 要 应 对 一 个 40MB 的 空间 。 
因此 ， 虽 然 GC 次 数 减 小 了 ， 但 是 单 次 GC 速 度 不 如 一 个 震 沪 的 堆 。 


7.4.5 吞吐 量 优先 案例 


吞吐 量 优先 的 方案 将 会 尽 可 能 减少 系统 的 执行 垃圾 回收 的 总 时 
间 ， 故 可 以 考虑 关注 系统 吞吐 量 的 并 行 回收 收集 器 。 在 拥有 高 性 能 的 
计算 机 上 ， 进 行 吞吐 量 优先 优化 ， 可 以 使 用 参数 : 


java -Xmx3800m -Xms3800m -Xmn2G -Xss128k -XX:+UseParallelGc 
-XX:ParallelGC-Threads-20 -XX:4UseParallelOldGC 


-Xmx380m —Xms3800m: 设置 Java 堆 的 最 大 值 和 初始 值 。 一 般 情 ; 
下 ， 为 了 避免 堆 内 存 的 频繁 震荡 ， 导 致 系统 性 能 下 降 ， 我 们 的 做 法 是 
设置 最 大 堆 等 于 最 小 堆 。 假 设 这 里 把 最 小 堆 减 少 为 最 大 堆 的 一 般 ， 即 
1900m， 那 么 JVM 会 尽 可 能 在 1900MB 堆 空间 中 运行 ， 如 果 这 样 ， 发 生 
GC 的 可 能 性 就 会 比较 高 ，; 

-Xss128k: 减少 线程 栈 的 大 小 ， 这 样 可 以 使 剩余 的 系统 内 存 支 持 更 
多 的 线程 ; 

-Xmn2g: 设置 新 生 代 区 域 大 小 为 2GB ; 

-XX: +UseParallelGC: 新 生 代 使 用 并 行 垃圾 回收 收集 器 。 这 是 一 
个 关注 吞吐 量 的 收集 器 ， 可 以 尽 可 能 地 减少 GC 时 间 。 

-XX: ParallelGC-Threads: 设置 用 于 垃圾 回收 的 线程 数 ， 通 常情 ; 
下 ， 可 以 设置 和 CPU 数量 相等 。 但 在 CPU 数量 比较 多 的 情况 下 ， 设 置 
相对 较 小 的 数值 也 是 合理 的 5 

-XX: +UseParallelOldGC: 设置 老生 代 使 用 并 行 回 收 收集 器 。 


7.4.6 使 用 大 页 案例 


在 Solaris 系 统 中 ，JVM 可 以 支持 大 页 的 使 用 。 使 用 大 的 内 存 分 页 可 
以 增强 CPU 的 内 存 寻 址 能 力 ， 从 而 提升 系统 的 性 能 。 


java -Xmx2506m -Xms2506m -Xmn1536m -Xss128k -XX:++UseParallelGc 
-XX:ParallelGCThreads-20 -XX:+UseParallelOldGC -XX:+LargePageSizeInBytes=256m 


-XX: +LargePageSizeInBytes: 设置 大 页 的 大 小 。 
7.4.7 降低 停顿 案例 


为 降低 应 用 软件 的 垃圾 回收 时 的 停顿 ， 首 先 考 虑 的 是 使 用 关注 系 
统 停顿 的 CMS 回收 器 ， 其 次 ， 为 了 减少 Full GC 次 数 ， 应 尽 可 能 将 对 象 
预 留 在 新 生 代 ， 因 为 新 生 代 Minor GC 的 成 本 远 远 小 于 老生 代 的 Full 
GCs 


java -Xmx3550m ~-Xms3550m . -Xmn2g -Xssl28k  -XX:ParallelGCThreads=20 
-XX:+UseConcMarkSweepGC -XX:+UseParNewGC -XX:+SurvivorRatio=8 
-XX:TargetSurvivorRatio-90 -XX:MaxTenuringThreshold=31 

-XX: ParallelGCThreads=20: 设置 20 个 线程 进行 垃圾 回收 ; 

-XX: +UseParNewGC: 新 生 代 使 用 并 行 回收 器 ，; 

-XX: +UseConcMarkSweepGC: 老生 代 使 用 CMS 收 集 器 降低 停 
df; 

-XX: +SurvivorRatio: 设置 eden 区 和 survivor 区 的 比例 为 8: 1. 45 
大 的 survivor 空 间 可 以 提高 在 新 生 代 回收 生命 周期 较 短 的 对 象 的 可 能 
性 ， 如 果 survivor 不 够 大 ， 一 些 短 命 的 对 象 可 能 直接 进入 老生 代 ， 这 对 
系统 来 说 是 不 利 的 。 

-XX: TargetSurvivorRatio-90: 设置 survivor 区 的 可 使 用 率 。 这 里 设 
置 为 90%， 则 人 允许 909% 的 survivor 空 间 被 使 用 。 默 认 值 是 50%。 故 该 设置 
提高 了 survivor 区 的 使 用 率 。 当 存放 的 对 象 超过 这 个 百分比 ， 则 对 象 会 
向 老年 代 压 缩 。 因 此 ， 这 个 选项 更 有 助 于 将 对 象 留 在 新 生 代 。 

-XX: MaxTenuringThreshold: 设置 年 轻 对 象 晋 升 到 老生 代 的 年 
龄 。 默 认 值 是 15 次 ， 即 对 象 经 过 15 次 Minor GC 依 然 存 活 ， 则 进入 老生 
代 。 这 里 设置 为 31， 目 的 是 让 对 象 尽 可 能 地 保存 在 新 生 代 区 域 。 


7.4.8 设置 最 大 堆 内 存 


JVM 内 存 结构 分 配对 Java 应 用 程序 的 性 能 有 较 大 的 影响 。 
Java 应 用 程序 可 以 使 用 的 最 大 堆 可 以 用 -Xmx 人 参数 指定 。 最 大 堆 指 
的 是 年 轻 代 和 年 老 代 的 大 小 之 和 的 最 大 值 ， 它 是 Java 应 用 程序 的 堆 上 


限 。 以 下 代码 演示 在 堆 上 分 配 空间 直到 内 存 浇 出 。-Xmx 参 数 的 大 小 不 
同 ， 将 直接 决定 程序 能 够 走 过 几 个 循环 。 


代码 清单 7-44 示例 程序 代码 


import java.util.Vector; 
public class maxHeapTest { 


public static void main(String[] args) { 
Vector v = new Vector(); 
for(int i=0;1<=10;1i++) { 
byte[] b = new byte[1024*1024]; 
v.add(b) ; 
System.out.println(i*"M is allocated"); 
} 


System.out.println("Max memory:"+Runtime ,getRuntime () .maxMemory () ) ; 


} 


使 用 -Xmx5M 设 置 时 最 大 堆 上 限 为 5MB， 此 时 系统 输出 如 清单 7-45 
所 示 。 


代码 清单 7-45 示例 程序 代码 运行 输出 
0M is allocated 
1M is allocated 
2M is allocated 
3M is allocated 
Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 


at maxHeapTest.main (maxHeapTest.java:8) 


此 时 表明 在 完成 4MB 数 据 分 配 后 系统 空 亲 的 堆 内 存 大 小 已 经 不 足 
1MB 了。 


如 果 设 置 最 大 堆 上 限 为 11MB ， 此 时 程序 顺利 结束 ， 没 有 任何 异 
单 。 表 明 在 11MB 的 堆 空 间 上 成 功 分 配 了 10MB 的 子 节 数组 。 


代码 清单 7-46 示例 程序 代码 运行 输出 
0M is allocated 
M is allocated 
M is allocated 
M is allocated 


is allocated 


M is allocated 


is allocated 


M is allocated 


M is allocated 


1 
2 
3 
4 
5M is allocated 
6 
7 
8 
9 
1 


0M is allocated 
Max memory:16252928 


7.4.9 设置 最 小 堆 内 存 


使 用 JVM 参 数 -Xms 可 以 用 于 设置 最 小 堆 内 存 空间 ， 也 就 是 JVM 启 
动 时 所 占据 的 操作 系统 内 存 大 小 。 

Java 应 用 程序 在 运行 时 首先 会 被 分 配 -Xms 指 定 的 内 存 大 小 ， 并 尽 
可 能 党 试 在 这 个 空间 段 内 运行 程序 。 当 -Xms 指 定 的 内 存 大 小 确实 无 法 
满足 应 用 程序 时 ，JVM 才 会 向 操作 系统 申请 更 多 的 内 存 ， 直 到 内 存 大 
小 达到 -Xmx 指 定 的 最 大 内 存 为 止 。 若 超过 -Xmx 的 值 ， 则 抛 出 
OutOfMemoryError 异 常 。 如 果 -Xms 的 数值 较 小 ， 那 么 JVM 为 了 保证 系 
统 尽 可 能 地 在 指定 内 存 范 围 内 运行 就 会 更 加 频繁 地 进行 GC 操作 ， 以 释 
放 失 效 的 内 存 空 间 ， 从 而 会 增加 Minor GC 和 Full GC 的 次 数 ， 对 系统 性 
能 产生 一 定 的 影响 。 

代码 清单 7-47 所 示 的 代码 每 次 分 配 1MB 空 间 ， 累 计 3MB 时 清空 
存 。 


代码 清单 7-47 示例 程序 代码 


import java.util.Vector; 


public class minHeapTest { 
public static void main(String[] args) { 
Vector v - new Vector(); 
for(int 1=1;1<=10;1++) { 
byte[] b = new byte[1024*1024]; 
v.add(b) ; 
if (v.size()==3) { 


v.clear(); 


当 设 置 为 -XX: +PrintGCDetails-Xmx11M-Xms1M-verbose 
出 错误 : 


Error occurred during initialization of VM 


Too small initial heap for new size specified 


如 果 设 置 最 小 堆 内 存 为 1.5MB， 则 GC 输出 : 


: gc 时 抛 


代码 清单 7-48 示例 程序 代码 运行 输出 

[GC [DefNew: 227K->64K (960K), 0.0018943 secs] [Tenured: 85K->149K (1024K), 0.0097617 
secs] 227K->149K (1984K), [Perm : 375K->375K (12288K) ], 0.0117270 secs] [Times: user=0.02 
sys=0.00, real=0.02 secs] 

[GC [DefNew: 18K->0K(960K), 0.0003687 secs] [Tenured: 1173K->1173K(2052K), 
0.0079005 secs] 1191K->1173K(3012K), [Perm : 375K->375K(12288K)], 0.0083541 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew: OK->0K(1024K), 0.0001338 secs] [Tenured: 2197K->2197K (3080K), 
0.0080497 secs] 2197K->2197K(4104K), [Perm : 375K->375K(12288K)], 0.0082739 secs] 
[Times: user=0.01 sys=0.00, real=0.02 secs] 

clearing.... 
[GC [DefNew: 1056K->0K (1728K), 0.0001662 secs] 3253K->2197K (5392K), 0.0001989 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew: 1024K->0K (1728K), 0.0009438 secs] 3221K->3221K (5392K), 0.0009781 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew (promotion failed) : 1024K->1024K(1728K), 0.0001701 secs] [Tenured: 
3221K->2197K (4096K), 0.0085937 secs] 4245K->2197K (5824K), [Perm : 375K->375K (12288K) ] , 
0.0088455 secs] [Times: user=0.02 sys=0.00, real=0.02 secs] 

clearing.... 

[GC [DefNew: 1024K->0K (1728K), 0.0001476 secs] 3221K->2197K (5392K), 0.0001749 secs] 


[Times: user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew: 1024K->0K (1728K), 0.0003679 secs] 3221K->3221K (5392K), 0.0003979 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew: 1024K->1024K(1728K), 0.0000162 secs] [Tenured: 3221K->2197K(3664K) , 
0.0085309 secs] 4245K->2197K (5392K), [Perm : 375K->375K(12288K)], 0.0086110 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 

clearing.... 

[GC [DefNew: 1024K->0K (1728K), 0.0001591 secs] 3221K->2197K (5392K), 0.0001875 secs] 
[Times: user=0.00 sys=0.00, real=0.00 secs] 

Heap 

def new generation total 1728K, used 1056K [0x36a10000, 0x36be0000, 0x36c10000) 

eden space 1600K, 66% used [0x36a10000, 0x36b18080, 0x36ba0000) 
from space 128K, 0% used [0x36ba0000, 0x36ba0000, 0x36bc0000) 
to space 128K, $ used [0x36bc0000, 0x36bc0000, 0x36be0000) 

tenured generation total 3664K, used 2197K [0x36c10000, 0x36fa4000, 0x37010000) 

the space 3664K, 59% used [0x36c10000, 0x36e354b8, 0x36e35600, 0x36fa4000) 
compacting perm gen total 12288K, used 375K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3% used [0x37010000, 0x3706dc38, 0x3706de00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


Co 


其 中 进行 了 10 次 Minor GC， 并 共计 耗 时 4.4 毫 秒 。 为 减少 GC 次 数 ， 
增 大 -Xms 的 值 ， 使 用 11MB ， 输 出 如 下 。 


代码 清单 7-49 示例 程序 代码 

[GC [DefNew: 2310K->149K(3392K), 0.0033722 secs] 2310K->2197K(10944K), 0.0034132 
secs] [Times: user=0.01 sys=0.00, real=0.01 secs] 

clearing.... 

[GC [DefNew: 2231K->149K (3392K), 0.0016030 secs] 4279K->3221K(10944K), 0.0016354 


secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 


clearing.... 

[GC [DefNew: 2281K->149K (3392K), 0.0008025 secs] 5353K->3221K(10944K), 0.0008337 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 

[GC [DefNew: 2211K->149K (3392K), 0.0024706 secs] 5284K->5269K(10944K), 0.0025057 


secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 


clearing.... 
Heap 
def new generation total 3392K, used 2268K [0x36410000, 0x367b0000, 0x36810000) 
eden space 3072K, 68% used [0x36410000, 0x36621dd0, 0x36710000) 
from space 320K, 46$ used [0x36710000, 0x36735498, 0x36760000) 
to space 320K, 0$ used [0x36760000, 0x36760000, 0x36700000) 
tenured generation total 7552K, used 5120K [0x36810000, 0x36£70000, 0x37010000) 
the space 7552K, 67% used [0x36810000, 0x36d10050, 0x36d10200, 0x36£70000) 
compacting perm gen total 12288K, used 375K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, $ used [0x37010000, 0x3706dc88, 0x3706de00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


Cr CO 


增 大 -Xms 后 ， 只 进行 了 4 次 Minor GCo 

JVM 会 试图 将 系统 内 存 尽 可 能 限制 在 -Xms 中 ， 因 此 当 内 存 实际 使 
用 量 触及 -Xms 指 定 的 大 小 时 会 触发 Ful GC。 因 此 把 -Xms 值 设置 为 - 
Xmx 时 ， 可 以 在 系统 运行 初期 减少 GC 的 次 数 和 耗 时 。 


7.4.10 设置 年 轻 代 


参数 -Xmn 或 者 用 于 Hot Spot 虚拟 机 中 的 参数 -XX: NewSize (EH 
代 初 始 大 小 ) 、-XX: MaxNewSize 用 于 设置 年 轻 代 的 大 小 。 设 置 一 个 
较 大 的 年 轻 代 会 减 小 年 老 代 的 大 小 ， 这 个 参数 对 系统 性 能 以 及 GC 行为 
有 很 大 的 影响 。 年 轻 代 的 大 小 一 般 设 置 为 整个 堆 空 间 的 1/4 到 1/3 左 右 。 

以 上 例 中 的 代码 为 例 ， 若 使 用 JVM 参 数 -XX: +PrintGCDetails- 
Xmx11M-XX: NewSize-2M-XX: MaxNewSize-2M-verbose: gc 运行 程 
序 ， 将 年 轻 代 的 大 小 减 小 为 2MB， 那 么 MinorGC 次 数 将 从 4 次 增加 到 9 
次 (默认 情况 下 是 3.5MB 左 右 ) 。 运 行 输出 如 清单 7-50 所 示 。 


代码 清单 7-50 示例 程序 代码 运行 输出 
[GC [DefNew: 1272K->150K(1856K), 0.0028101 secs] 1272K->1174K(11072K), 0.0028504 
secs] [Times: user-0.00 sys-0.00, real=0.00 secs] 
[GC [DefNew: 1174K->0K(1856K), 0.0018805 secs] 2198K->2198K(11072K), 0.0019097 
secs] [Times: user-0.00 sys-0.00, real=0.00 secs] 
clearing.... 
[GC [DefNew: 1076K->0K(1856K), 0.0004046 secs] 3274K->2198K(11072K), 0.0004382 
secs] [Times: user-0.00 sys-0.00, real-0.00 secs] 
[GC [DefNew: 1024K->0K(1856K), 0.0011834 secs] 3222K->3222K(11072K), 0.0013508 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew: 1024K->0K(1856K), 0.0012983 secs] 4246K->4246K(11072K), 0.0013299 
secs] [Times: user=0.01 sys=0.00, real=0.00 secs] 
clearing.... 
[GC [DefNew: 1024K->0K(1856K), 0.0001441 secs] 5270K->4246K(11072K), 0.0001686 
secs] [Times: user-0.00 sys-0.00, real=0.00 secs] 
[GC [DefNew: 1024K->0K(1856K), 0.0012028 secs] 5270K->5270K(11072K), 0.0012328 
secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
[GC [DefNew: 1024K->0K(1856K), 0.0012553 secs] 6294K->6294K(11072K), 0.0012845 
secs] [Times: user=0.00 sys-0.00, real=0.00 secs] 
clearing.... 
[GC [DefNew: 1024K->0K(1856K), 0.0001524 secs] 7318K->6294K(11072K), 0.0001780 
secs] [Times: user-0.00 sys-0.00, real-0.00 secs] 
Heap 
def new generation total 1856K, used 1057K [0x36410000, 0x36610000, 0x36610000) 
eden space 1664K, 63% used [0x36410000, 0x365185a0, 0x365b0000) 
from space 192K, 0$ used [0x365e0000, 0x365e0088, 0x36610000) 
to space 192K, 0% used [0x365b0000, 0x365b0000, 0x365e0000) 
tenured generation total 9216K, used 6294K [0x36610000, 0x36f10000, 0x37010000) 
the space 9216K, 68% used [0x36610000, 0x36c35868, 0x36c35a00, 0x36f10000) 
compacting perm gen total 12288K, used 375K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, 3% used [0x37010000, 0x3706dc88, 0x3706de00, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55$ used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


7.4.11 设置 持久 代 


持久 代 (方法 区 ) 不 属于 堆 的 一 部 分 。 在 Hot Spot 虚拟 机 中 ， 使 
用 -XX : MaxPermSize 参 数 可 以 设置 持久 代 的 最 大 值 ， 使 用 -XX: 
PermSize 可 以 设置 持久 代 的 初始 大 小 。 

持久 代 的 大 小 直接 决定 了 系统 可 以 支持 多 少 个 类 定义 和 多 少 常 
。 对 于 使 用 CGLIB 或 者 Javassit 等 动态 字 节 码 生 成 工具 的 应 用 程序 而 
言 ， 设 置 合理 的 持久 代 大 小 有 助 于 维持 系统 稳定 。 

系统 所 支持 的 最 大 类 与 MaxPermSize 成 正比 。 一 般 来 说 ， 
MaxPermSize 设 置 为 64MB 已 经 可 以 满足 绝 大 部 分 应 用 程序 正常 工作 。 
如 果 依 然 出 现 永久 区 溢出 ， 可 以 设置 为 128MB。 这 是 两 个 很 常用 的 永 
久 区 取 值 。 如 果 128MB 依 然 不 能 满足 应 用 程序 需求 ， 那 么 对 于 大 部 分 
应 用 程序 来 说 ， 则 应 该 考虑 优化 系统 的 设计 ， 减少 动态 类 的 产生 ,或 
者 利用 GC 回收 部 分 驻扎 在 永久 区 的 无 用 类 信息 ， 以 使 系统 健康 运行 。 


7.4.12 设置 线程 栈 


线程 栈 是 线程 的 一 块 私 有 空间 。 在 JVM 中 可 以 使 用 -Xss 参 数 设 置 线 
程 栈 的 大 小 。 

在 线程 中 进行 局 部 变量 分 配 ， 阔 数 调用 时 都 需要 在 栈 中 开辟 空 
间 。 如 果 栈 的 空间 分 配 太 小 ， 那 么 线程 在 运行 时 可 能 没有 足够 的 空间 
分 配 局 部 变量 或 者 达 不 到 足够 的 溯 数 调用 深 度 ， 导 致 程序 异常 退出 ，; 
如 果 栈 空间 过 大 ， 那 么 开设 线程 所 需 的 内 存 成 本 就 会 上 升 ， 系 统 所 能 
支持 的 线程 总 数 就 会 下 降 。 

由 于 Java 堆 也 是 向 操作 系统 申请 内 存 空间 的 ， 因 此 ， 如 果 堆 空间 过 
大 ， 就 会 导致 操作 系统 可 用 于 线程 栈 的 内 存 减 少 ， 从 而 间接 减少 程序 
所 能 支持 的 线程 数量 。 

代码 清单 7-51 所 示 代 码 尝 试 开设 尽 可 能 多 的 线程 ， 并 在 线程 数量 饱 
和 时 ， 打 印 已 经 开设 的 线程 数量 。 


a 


代码 清单 7-51 示例 程序 代码 
public class TestXss { 
public static class MyThread extends Thread{ 
@Override 
public void run() { 
try{ 
Thread. sleep (10000) ; 
}catch (InterruptedException e) { 


e.printStackTrace(); 


public static void main(String[] args) { 
int count=0; 
try{ 
for(int 1=0;1<10000; i++) { 
new MyThread().start(); 


counttt; 


} 
)catch (OutOfMemoryError e) { 
System.out.print1n (count); 


System.out.println(e.getMessage()); 


} 


设置 -Xss1M 时 运行 这 个 程序 ， 即 设置 每 个 线程 拥有 1MB 的 栈 空 
间 。 输 出 如 下 : 


1578 
unable to create new native thread 
一 共 人 允许 启动 1578 个 线程 。 
如 果 增 大 -Xss 的 值 ， 使 用 参数 -Xss20M， 为 每 个 线程 分 配 20M 的 栈 
空间 ， 结 果 显 示 如 下 : 
69 


unable to create new native thread 


如 果 改 变 系统 的 最 大 堆 空 间 设 定 ， 可 以 发 现 系 统 所 能 支持 的 线程 
效 量 也 会 相应 改变 。 


-Xmx100M -Xms10M -Xss1M 
1728 


unable to create new native thread 


-Xmxl100M -Xms10M -Xss1M 
844 


unable to create new native thread 


-Xmx1000M -Xms1000M -Xss10M 
74 


unable to create new native thread 


Java 堆 的 分 配 以 200MB 递 增 ， 当 栈 大 小 为 IMB 时 ， 最 大 线程 数量 
以 200 递 威 。 当 系统 物理 内 存 被 堆 占 据 时 ， 就 不 可 以 被 栈 使 用 。 

当 系 统 由 于 内 存 空间 不 够 而 法 务 创建 新 的 线程 时 会 抽出 OOM 噶 
常 。 这 并 不 是 由 于 堆 内 存 不 够 而 导致 的 OOM， 而 是 因为 操作 系统 内 存 
减 去 堆 内 存 后 剩余 的 系统 内 存 不 足 而 无 法 创建 新 的 线程 。 在 这 种 情况 
下 可 以 尝试 减少 堆 内 存 以 换取 更 多 的 系统 空间 来 解决 这 个 问题 。 

综 上 所 述 ， 如 果 系 统 确 实 需要 大 量 线程 并 发 执行 ， 那 么 设置 一 个 
较 小 的 堆 和 较 小 的 栈 有 助 于 提高 系统 所 能 承受 的 最 大 线程 数 。 


7.4.13 扒 的 比例 分 配 


参数 -XX: SurvivorRatio 是 用 来 设置 年 轻 代 中 eden 空 间 和 s0 空 间 的 
比例 关系 。s0 和 sil 空间 又 分 别称 为 from 空间 和 to 空间 。 它 们 的 大 小 是 相 
同 的 ， 职能 也 是 相同 的 ， 并 在 Minor GC 后 互 换 角 色 。 

代码 清单 7-50 所 示 的 例子 演示 不 断 插入 字符 时 使 用 设置 年 轻 代 堆 为 
10MB， 并 使 eden 区 是 s0 的 8 倍 大 小 ， 


-XX:+PrintGCDetails -XX:MaxNewSize-10M -XX:SurvivorRatio-8 


代码 清单 7-52 示例 程序 代码 
import java.util.ArrayList; 


import java.util.List; 


public class StringDemo { 
public static void main(String[] args) { 

List<String> handler = new ArrayList<String>(); 

for(int 1=0;1<1000;i++) { 
HugeStr h = new HugeStr(); 
ImprovedHugeStr hl = new ImprovedHugeStr(); 
handler.add(h.getSubString(1, 5)); 
handler.add(hl.getSubString(l, 5)); 


static class HugeStr{ 
private String str = new String(new char[800000]); 
public String getSubString(int begin, int end) { 


return str.substring(begin, end); 


static class ImprovedHugeStr{ 
private String str = new String(new char[10000000]); 
public String getSubString(int begin, int end) { 


return new String(str.substring(begin, end)); 


| 


GC 输出 如 清单 7-53 所 示 。 


代码 清单 -53 示例 程序 代码 运行 输出 
[Full GC [Tenured: 233756K->233743K (251904K)， 0.0524229 secs] 
233756K->233743K(261120K), [Perm : 377K->372K(12288K)], 0.0524703 secs] [Times: 
user-0.06 sys=0.00, real=0.06 secs] 
def new generation total 9216K, used 170K [0x27010000, 0x27a10000, 0x27a10000) 
eden space 8192K, $ used [0x27010000, 0x2703a978, 0x27810000) 
from space 1024K, $ used [0x27910000, 0x27910000, 0x27a10000) 
to space 1024K, $ used [0x27810000, 0x27810000, 0x27910000) 
tenured generation total 251904K, used 233743K [0x27a10000, 0x37010000, 
0x37010000) 
the space 251904K, 92$ used [0x27a10000, 0x35e53d00, 0x35e53e00, 0x37010000) 
compacting perm gen total 12288K, used 372K [0x37010000, 0x37c10000, 0x3b010000) 


the space 12288K, $ used [0x37010000, 0x3706d310, 0x3706d400, 0x37c10000) 
ro space 10240K, 51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


修改 参数 ，SurvivorRatio 改 为 2 运行 程序 ， 相 当 于 设置 eden 区 是 s0 
的 2 倍 大 小 ， 由 于 s1 与 0 相同 ， 故 有 eden=[10MB/ (1+1+2) ]*2=5MB。 
输出 如 清单 7-54 所 示 。 


代码 清单 7-54 示例 程序 代码 
[Full GC [Tenured: 233756K->233743K (251904K) , 0.0546689 secs] 
233756K->233743K (259584K), [Perm : 377K->372K(12288K)], 0.0547257 secs] [Times: 
user=0.05 sys=0.00, real=0.05 secs] 
def new generation total 7680K, used 108K [0x27010000, 0x27a10000, 0x27a10000) 
eden space 5120K, 2% used [0x27010000, 0x2702b3b0, 0x27510000) 
from space 2560K, $ used [0x27510000, 0x27510000, 0x27790000) 
to space 2560K, $ used [0x27790000, 0x27790000, 0x27a10000) 
tenured generation total 251904K, used 233743K [0x27a10000, 0x37010000, 
0x37010000) 
the space 251904K, 92$ used [0x27a10000, 0x35e53d00, 0x35e53e00, 0x37010000) 
compacting perm gen total 12288K, used 372K [0x37010000, 0x37c10000, 0x3b010000) 
the space 12288K, $ used [0x37010000, 0x3706d310, 0x3706d400, 0x37c10000) 
ro space 10240K, 51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
rw space 12288K, 55% used [0x3ba10000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 


参数 -XX: NewRatio 可 以 用 来 设置 年 轻 代 和 年 老 代 的 比例 : 
-XX: NewRatio= 年 老 代 / 年 轻 代 


使 用 人 参数 -XX : +PrintGCDetails-XX : NewRatio=2-Xmx20M- 
Xms20M 运 行 上 述 人 代码， 输出 如 清单 7-55 所 示 。 


代码 清单 7-55 示例 程序 代码 运行 输出 


[GC [DefNew: 3369K->150K (6144K), 0.0030730 secs][Tenured: 1562K->1712K(13696K) ， 
0.0098075 secs] 3369K->1712K(19840K), [Perm : 377K->377K(12288K)], 0.0129554 secs] 
(Times: user-0.02 sys-0.00, real-0.01 secs] 

[Full GC [Tenured: 1712K->1699K(13696K), 0.0081938 secs] 1712K->1699K(19840K), 


[Perm : 377K->372K (12288K) ], 0.0082420 secs] [Times: user-0.01 sys-0.00, real=0.02 secs] 
Heap 


def new generation total 6144K, used 168K [0x35c10000, 0x362b0000, 0x362b0000) 


3% used [0x35c10000, 0x35c3a358, 0x36170000) 
$ used [0x36210000, 0x36210000, 0x362b0000) 
$ used [0x36170000, 0x36170000, 0x36210000) 
total 13696K, used 1699K [0x362b0000, 0x37010000, 0x37010000) 
12$ used [0x362b0000, 0x36458dd8, 0x36458e00, 0x37010000) 
total 12288K, used 372K [0x37010000, 0x37c10000, 0x3b010000) 
3$ used [0x37010000, 0x3706d218, 0x3706d400, 0x37c10000) 
51$ used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 
55% used [0x3bal0000, 0x3c0ae4f8, 0x3c0ae600, 0x3c610000) 
在 本 例 中 ， 因 为 堆 大 小 为 20MB， 年 轻 代 和 年 老 代 的 比 为 1: 2, W 
年 轻 代 大 小 大 约 为 20MB*1/3=6MB， 年 老 代 为 12MB 左 右 。 


如 果 改 为 -XX : +PrintGCDetails-XX : NewRatio=1-Xmx20M- 
Xms20M， 输 出 如 清单 7-56 所 示 。 


eden space 5504K, 
from space 640K, 
to space 640K, 
tenured generation 
the space 13696K, 
compacting perm gen 
the space 12288K, 
ro space 10240K, 
rw space 12288K, 


代码 清单 -56 示例 程序 代码 运行 输出 

[GC [DefNew: 3468K->150K (9216K), 0.0028638 secs][Tenured: 1562K->1712K(10240K), 
0.0084220 secs] 3468K->1712K(19456K), [Perm : 377K->377K(12288K)], 0.0113816 secs] 
[Times: user-0.02 sys=0.00, real=0.01 secs] 

[Full GC [Tenured: 1712K->1699K(10240K), 0.0071963 secs] 1712K-51699K(19456K), 
[Perm : 377K->372K (12288K) ], 0.0072393 secs] [Times: user-0.00 sys=0.00, real=0.01 secs] 


Heap 
def new generation 
eden space 8192K, 
from space 1024K, 
to space 1024K, 
tenured generation 
the space 10240K, 
compacting perm gen 
the space 12288K, 
ro space 10240K, 


total 9216K, used 491K [0x35c10000, 0x36610000, 0x36610000) 
6% used [0x35c10000, 0x35c8af08, 0x36410000) 
$ used [0x36510000, 0x36510000, 0x36610000) 
0$ used [0x36410000, 0x36410000, 0x36510000) 
total 10240K, used 1699K [0x36610000, 0x37010000, 0x37010000) 
16$ used [0x36610000, 0x367b8dd8, 0x367b8e00, 0x37010000) 
total 12288K, used 372K [0x37010000, 0x37c10000, 0x3b010000) 
3$ used [0x37010000, 0x3706d218, 0x3706d400, 0x37c10000) 
51% used [0x3b010000, 0x3b543000, 0x3b543000, 0x3ba10000) 


rw space 12288K, 55% used [0x3bal0000, 0x3c0ae4f8, Ox3c0ae600, 0x3c610000) 


虽然 没有 完全 成 为 1: 1 (实际 为 3: 4 左右 ) ， 但 是 已 经 趋 近 于 1: 


lo 


7.4.14 堆 分 配 参数 总 结 
JVM 内 存 区 域 划 分 如 图 7-3 所 示 。 


| XX:MaxPermSize3 M A) 


图 7-3 JVM 内 存 区 域 划分 图 

与 Java 应 用 程序 堆 内 存 相 关 的 JVM 人 参数 有 : 

-Xmn: 新 生 代 内 存 大 小 的 最 大 值 ， 包 括 E 区 和 两 个 S 区 的 总 和 ， 使 
用 方法 如 : -Xmn65535，-Xmn1024k，-Xmn512m，-Xmnlg。-Xmn 只 
能 使 用 在 JDK1.4 或 之 后 的 版 本 中 ， (之 前 的 1.3/1.4 版 本 中 ， 可 使 用 - 
XX: NewSize 设 置 年 轻 代 大 小 ， 用 -XX: MaxNewSize 设 置 年 轻 代 最 大 
值 ) ; 如 果 同 时 设置 了 -Xmn 和 -XX: NewSize, -XX: MaxNewSize， 
则 谁 设置 在 后 面 ， 谁 就 生效 。 如 果 同 时 设置 了 -XX: NewSize-XX: 
MaxNewSize 与 -XX: NewRatio 则 实际 生效 的 值 是 min (MaxNewSize, 
max (NewSize, heap/ (NewRatio+1) ) ) 。 在 开发 、 测 试 环境 ， 可 
以 -XX: NewSize 和 -XX: MaxNewSize 来 设置 新 生 代 大 小 ， 但 在 线 上 生 
产 环境 ， 使 用 -Xmn 一 个 即 可 (推荐) ， 或 者 将 -XX: NewSize 和 -XX: 
MaxNewSize 设 置 为 同一 个 值 ， 这 样 能 够 防止 在 每 次 GC 之 后 都 要 调整 堆 
的 大 小 〈 即 : 抖动 ， 抖 动 会 严重 影响 性 能 ) 。 

-Xms: 设置 Java 应 用 程序 启动 时 的 初始 堆 大 小 ， 也 是 堆 大 小 的 最 
小 值 ， 默 认 值 是 总 共 的 物理 内 存 /64 ( 且 小 于 1G) , EGAIE/R TF, ME 
中 可 用 内 存 小 于 40% (这 个 值 可 以 用 -XX: MinHeapFreeRatio 调整 , 
如 -X: MinHeapFreeRatio=30) 时 ， 堆 内 存 会 开始 增加 ， 一 直 增 加 到 - 
Xmx 的 大 小 ; 


-Xmx: 设置 Java 应 用 程序 能 获得 的 最 大 堆 大 小 ， 默 认 值 是 总 共 的 
物理 内 存 /64 ( 且 小 于 1G) ， 如 果 Xms 和 Xmx 都 不 设置 ， 则 两 者 大 小 会 
相同 ， 默 认 情 况 下 ， 当 堆 中 可 用 内 存 大 于 70% (这 个 值 可 以 用 -XX: 
MaxHeapFreeRatio 调整 ， 如 -X: MaxHeapFreeRatio-60) AY, SEAS 
开始 减少 ， 一 直 减 小 到 -Xms 的 大 小 。 整 个 堆 的 大 小 = 年 轻 代 大 小 + 年 老 
代 大 小 ， 堆 的 大 小 不 包含 持久 代 大 小 ， 如 果 增 大 了 年 轻 代 ， 年 老 代 相 
应 就 会 碱 小 ， 官 方 默认 的 配置 为 年 老 代 大 小 /年 轻 代 大 小 =2/1 左 右 (使 
用 -XX: NewRatio 可 以 设置 -XX: NewRatio=5， 表 示 年 老 代 /年 轻 代 
=5/1) 。 建 议 在 开发 测试 环境 可 以 用 Xms 和 Xmx 分 别 设置 最 小 值 最 大 
值 ， 但 是 在 线 上 生产 环境 ，Xms 和 Xmx 设 置 的 值 必 须 一 样 ， 原 因 与 年 
轻 代 一 样 一 防止 抖动 ; 

-Xss: 设置 线程 栈 的 大 小 ， 默 认 1M， 一 般 来 说 是 不 需要 改 的 。 除 
非 代 码 不 多 ， 可 以 设置 的 小 点 ， 另 外 一 个 相似 的 参数 是 -XX : 
ThreadStackSize， 这 两 个 参数 在 1.6 以 前 ， 都 是 谁 设置 在 后 面 ， 堆 就 生 
效 ;16 版 本 以 后 ，-Xss 设 置 在 后 面 ， 则 以 -Xss 为 准 ，- 
XXThreadStackSize 设 置 在 后 面 ， 则 主线 程 以 -Xss 为 准 ， 其 他 线程 以 - 
XX: ThreadStackSize 为 准 ; 

-XX: MinHeapFreeRatio: 设置 堆 空 间 最 小 空间 比例 。 当 堆 空 间 的 
空 亲 内 存 小 于 这 个 数值 时 ，JVM 便 会 扩展 堆 空 间 ; 

-XX: MaxHeapFreeRatio: 设置 堆 空 间 的 最 大 空 朵 比例 。 当 堆 空 间 
的 空 朵 内 存 大 于 这 个 数值 时 ， 便 会 压缩 堆 空 间 ， 得 到 一 个 较 小 的 堆 ; 

-XX: NewSize: 设置 年 轻 代 的 大 小 ; 

-XX: NewRatio: 设置 年 老 代 与 年 轻 代 的 比例 ， 它 等 于 年 老 代 大 小 
除 以 年 轻 代 大 小 ; 

-XX: SurvivorRatio: 年 轻 代 中 eden 区 与 survivor 区 的 比例 ; 

-XX: MaxPermSize: 设置 最 大 的 持久 区 大 小 ; 

-XX: TargetSurvivorRatio: 设置 survivor 区 的 可 使 用 率 。 当 survivor 
区 的 空间 使 用 率 达 到 这 个 数值 时 ， 会 将 对 象 送 入 年 老 代 。 


7.4.15 垃圾 回收 器 相关 参数 总 结 
与 串 行 回收 器 相关 的 参数 


-XX: +UseSerialGC: 在 年 轻 代 和 年 老 代 使 用 串 行 回收 器 。 

-XX: +SuivivorRatio: 设置 eden 区 大 小 和 survivor 区 大 小 的 比例 。 

-XX: +PretenureSizeThreshold: 设置 大 对 象 直接 进入 年 老 代 的 阅 
值 。 当 对 象 的 大 小 超过 这 个 值 时 ， 将 直接 在 年 老 代 分 配 。 

-XX: MaxTenuringThreshold: 设置 对 象 进 入 年 老 代 的 年 龄 的 最 大 
值 。 每 一 次 Minor GC 后 ， 对 象 年 龄 就 加 1。 任 何 大 于 这 个 年 龄 的 对 象 ， 
一 定 会 进入 年 老 代 。 

与 并 行 GC 相 关 的 参数 

-XX: +UseParNewGC: 在 年 轻 代 使 用 并 行 收集 器 。 

-XX: +UseParallelOldGC: 年 老 代 使 用 并 行 回收 收集 器 。 

-XX: ParallelGCThreads: 设置 用 于 垃圾 回收 的 线程 数 。 通 过 情况 
下 可 以 和 CPU 数量 相等 。 但 在 CPU 数量 比较 多 的 情况 下 ， 设 置 相 对 较 
小 的 数值 也 是 合理 的 。 

-XX: MaxGCPauseMills: 设置 最 大 垃圾 收集 停顿 时 间 。 它 的 值 是 
一 个 大 于 0 的 整数 。 收 集 器 在 工作 时 ， 会 调整 Java 扒 大 小 或 者 其 他 一 些 
人 参数， 尽 可 能 地 把 停顿 时 间 控 制 在 MaxGCPauseMills 以 内 。 

-XX: GCTimeRatio: 设置 吞吐 量 大 小 ， 它 的 值 是 一 个 0-100 之 间 的 
整数 。 假 设 GCTimeRatio 的 值 为 n， 那 么 系统 将 花费 不 超过 1/ (1+n) 的 
时 间 用 于 垃圾 收集 。 

-XX: +UseAdaptiveSizePolicy: 打开 自 适 应 GC 策 略 。 在 这 种 模式 
下 ， 年 轻 代 的 大 小 ，eden 和 survivor 的 比例 、 晋 升 年 老 代 的 对 象 年 龄 等 
参数 会 被 自动 调整 ， 已 达到 在 堆 大 小 、 吞 吐 量 和 停顿 时 间 之 间 的 平衡 
ch 


TWO 


与 CMS 回收 器 相关 的 参数 

-XX: +UseConcMarkSweepGC: 年 轻 代 使 用 并 行 收 集 器 ， 年 老 代 
使 用 CMS+ 串 行 收集 器 。 

-XX: +ParallelCMSThreads: 设 定 CMS 的 线程 数量 。 


-XX: +CMSlInitiatingOccupancyFraction: 设置 CMS 收集 器 在 年 老 
代 空 间 被 使 用 多 少 后 触发 ， 默 认为 60%。 


-XX: +UseFullGCsBeforeCompaction: 设 定 进 行 多 少 次 CMS 垃 圾 
回收 后 ， 进 行 一 次 内 存 压 缩 。 

-XX: +CMSClassUnloadingEnabled: 允许 对 类 元 数据 进行 回收 。 

-XX: +CMSParallelRemarkEndable: 启用 并 行 重 标记 。 

-XX: CMSInitatingPermOccupancyFraction: 当 永 久 区 占用 率 达 到 
这 一 百分比 后 ， 启 动 CMS 回收 (前 提 是 -XX : 
+CMSClassUnloadingEnabled 激 活 了 ) 。 

-XX: UseCMSInitatingOccupancyOnly : 表示 只 在 到 达 阅 值 的 时 
候 ， 才 进行 CMS 回收 。 

-XX: +CMSIncrementalMode: 使 用 增 量 模式 ， 比 较 适 合 单 CPU。 

与 G1 回收 器 相关 的 参数 

-XX: +UseG1GC， 使 用 G1 回收 器 。 

-XX: +UnlockExperimentalVMOptions: 人 允许 使 用 实验 性 参数 。 

-XX: +MaxGCPauseMills: 设置 最 大 垃圾 收集 停顿 时 间 。 

-XX: +GCPauseIntervalMills: 设置 停顿 间隔 时 间 。 


其 他 参数 
-XX: +DisableExplicitGC: 禁用 显示 GC。 
JIT 编 译 参数 


JVM 的 Just-in-time 编 译 器 ， 可 以 在 运行 时 将 字 节 码 编译 成 本 地 代 
人 码 ， 从 而 提高 水 数 的 执行 效率 。-XX: CompileThreshold 为 JIT 编 译 的 阅 
值 ， 当 函数 的 调用 次 数 超过 -XX: CompileThreshold 时 ，JIT 就 将 字 节 码 
编译 成 本 地 机 器 码 。 在 Client 模 式 下 ，-XX: CompileThreshold 的 取 值 是 
1500; 在 Server 模 式 下 ， 取 值 是 10000。JIT 编 译 完 成 后 ，JVM 便 会 用 本 
地 代码 代替 原来 的 字 节 码 解 释 执 行 ， 因 此 ， 在 系统 的 未 来 运行 中 ， 这 
些 时 间 是 可 以 被 赚 回 来 的 。 

JIT 编 译 会 花费 一 定 的 时 间 ， 为 了 能 合理 地 设置 JIT 编 译 的 阐 值 ， 可 
以 使 用 -XX: +CITime 打 印 出 JIT 编 译 的 耗 时 ， 也 可 以 使 用 -XX: 
+PrintCompilation 打 印 出 JIT 编 译 的 信息 。 

采用 参数 -XX : CompileThreshold=1500-XX : +PrintCompilation- 
XX: +CITime 运 行 代码 清单 7-57 所 示 的 这 个 例子 。 


代码 清单 7-57 示例 程序 代码 
public class JITDemoTest { 
static long loopCount = 0; 


/ /测试 JIT 编译 函数 
public static void useJIT()| 
loopCount++; 
try { 
Thread.sleep (1); 
} catch (InterruptedException e) { 
// TODO Auto-generated catch block 


e.printStackTrace(); 


public static void main(String args[]) { 
long start = System.currentTimeMillis(); 
for(int 1=0;1<1496;1i++) { 
JITDemoTest.usedIT();//MAAA useJIT FH, ik loopCount BE, Client 小 于 
1500 次 不 会 被 JIT 编译 
} 


System.out.println(System.currentTimeMillis() - start); 


} 


这 里 只 会 循环 1496 次 ， 小 于 设 定 的 1500 次 ， 所 以 不 会 被 JIT 编 译 成 
本 地 代码 useJIT 方 法 ， 增 加 参数 -XX: +PrintCompliation 打 印 出 来 的 ， 
输出 如 清单 7-58 所 示 。 


代码 清单 7-58 示例 程序 代码 运行 输出 


138 1 java.lang.String::hashCode (55 bytes) 


139 
142 
142 
144 
147 
153 
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java. 
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java. 


java. 
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lang.String::equals (81 bytes) 
lang.String::lastIndexOf (52 bytes) 
lang.String::charAt (29 bytes) 
lang.String::indexOf (70 bytes) 
lang.String::indexOf (166 bytes) 


lang.AbstractStringBuilder::ensureCapacityInternal (16 bytes) 


(-XX:+CTime 打印 出 来 的 ) 


Accumulated compiler times (for compiled methods only) 


Total compilation time : 0.003 s 


Standard compilation : 0.003 s, Average : 0.000 


On stack replacement : 0.000 s, Average : -1.#10 


Detailed Cl Timings 


Setup time: 


0.000 s ( 0.0%) 


Build IR: 0.001 s (44.3%) 
Optimize: 0.000 s ( 5.5%) 

Emit LIR: 0.001 s (37.7$) 
LIR Gen: 0.000 s ( 9.7%) 
Linear Scan: 0.001 s (27.15) 

LIR Schedule: 0.000 s ( 0.0%) 


Code Emission: 0.000 s (11.0%) 
Code Installation: 0.000 s ( 6.9%) 


Instruction Nodes: 344 nodes 


Total compiled bytecodes : 480 bytes 


Standard compilation : 480 bytes 


On stack replacement : 0 bytes 


Average compilation speed: 137479 bytes/s 


nmethod code size : 1984 bytes 
nmethod total size : 4476 bytes 


如 果 把 循环 次 数 提高 到 1501 次 ， 程 序 运 行 输出 如 清单 7-59 所 示 。 


代码 清单 -59 示例 程序 代码 运行 输出 


140 1 java.lang.String::hashCode (55 bytes) 

142 2 java.lang.String::equals (81 bytes) 

144 3 java.lang.String::lastIndexOf (52 bytes) 

144 4 java.lang.String::charAt (29 bytes) 

145 5 java.lang.String::indexOf (70 bytes) 

148 6  java.lang.String::indexOf (166 bytes) 

151 7  java.lang.AbstractStringBuilder::ensureCapacityInternal (16 bytes) 
1720 8 ! JITDemoTest::useJIT (21 bytes) 

1725 9 n java.lang.Thread::sleep (native) (static) 


1605 


Accumulated compiler times (for compiled methods only) 


Total compilation time : 0.005 s 
Standard compilation : 0.005 s, Average : 0.001 
On stack replacement : 0.000 s, Average : -1.#I0 
Detailed Cl Timings 


Setup time: 0.000 s ( 0.0%) 
Build IR: 0.002 s (45.05) 
Optimize: 0.000 s ( 4.7%) 
Emit LIR: 0.001 s (37.65) 
LIR Gen: 0.000 s (10.1%) 
Linear Scan: 0.001 s (26.6%) 
LIR Schedule: 0.000 s ( 0.0%) 
Code Emission: 0.000 s (11.4%) 


Code Installation: 0.000 s ( 5.9%) 


Instruction Nodes: 366 nodes 


Total compiled bytecodes : 501 bytes 
Standard compilation : 501 bytes 
On stack replacement : 0 bytes 


Average compilation speed: 104400 bytes/s 


nmethod code size : 2176 bytes 
nmethod total size : 4832 bytes 


通过 增 大 -XX: CompileThreshold 的 值 ， 经 过 JIT 编 译 的 图 数 个 数 便 
会 减 小 ， 同 时 ， 在 JIT 上 消耗 的 时 间 也 会 降低 。 但 对 于 长 期 运行 的 系 
统 ， 其 性 能 未 必 能 得 到 改进 ，JIT 编 译 成 本 地 方法 是 一 种 加 快 本 地 程序 
运行 速度 的 极 好 的 方法 。 

堆 快 照 (Heap Dump) 

使 用 -XX: +HeapDumpOnOutOfMemoryError 参 数 在 程序 发 生 OOM 
时 ， 导 出 应 用 程序 的 当前 堆 快 照 。 当 程序 发 生 OOM 而 推出 系统 时 ， 一 


些 瞬 时 信息 都 随 着 程序 的 终止 而 消失 ， 重 现 OOM 问 题 往 往 比 较 困 难 或 
者 耗 时 。 通 过 -XX: +HeapDumpPath 可 以 指定 堆 快 照 的 保存 位 置 。 


-Xmx10M -XX:+HeapDumpOnOutOfMemoryError -XX:+HeapDumpPath=C: \my.hprof 


导出 的 Dump 文 件 可 以 通过 Visual VM 等 工具 查看 分 析 ， 进 而 定位 
问题 原因 。 

当 系统 发 生 OOM 错 误 时 ， 可 以 让 虚拟 机 在 错误 时 运行 一 段 第 三 方 
Al 2. Eb $n, EjoOM R EW, BBR Fi -XX : 
OnOutOfMemoryError-C: \reset.bat 

如 果 需 要 在 GC 发 生 的 时 刻 打印 GC 发 生 的 时 间 ， 则 可 以 追加 使 用 - 
XX: +PrintGCTimeStamps 选 项 。 打 开 这 个 开关 后 ， 将 额外 输出 GC 的 发 
生 时 间 ， 以 此 可 以 知道 GC 的 频率 和 间隔 。 

如 果 需 要 查看 新 生 对 象 普 升 老 年 代 的 实际 阅 值 ， 可 以 使 用 参数 - 
XX: +PrintTenuringDistribution 查 看 。 

如 果 需 要 在 GC 时 打印 详细 的 堆 信 息 ， 可 以 打开 -XX: 
+PrintHeapAtGC 开 关 。 一 旦 打开 它 ， 那 么 每 次 GC 时 ， 都 将 打印 堆 的 使 
用 情况 ， 这 个 输出 量 将 是 巨大 的 。 

如 果 需 要 查看 GC 与 应 用 程序 相互 执行 的 耗 时 ， 可 以 使 用 -XX: 
+PrintGCApplicationStoppedTime 和 -XX ; 
+PrintGCApplicationConcurrentTime 参 数 。 它 们 将 分 别 显 示 应 用 程序 在 
GC 发 生 时 的 停顿 时 间 和 应 用 程序 在 GC 停顿 时 间 的 执行 时 间 。 可 以 使 
用 -Xloggc 参 数 指定 GC 日 志 的 输出 位 置 ， 如 : -Xloggc: C: \gc.log。 

JVM 还 提供 了 一 组 参数 用 于 获取 系统 运行 时 加 载 、 卯 载 类 的 信 
E. -XX: +TraceClassLoading 参数 用 于 跟踪 类 加 载 情况 ，-XX : 
+TraceClassUnloading 用 于 跟踪 类 卸载 情况 。 如 果 需 要 同时 跟踪 类 的 加 
载 和 和 弛 载 情况 ， 可 以 同时 打开 这 两 个 开关 ， 也 可 以 使 用 -verbose: class 
参数 。 以 下 代码 是 不 断 加 载 新 类 、 并 不 断 和 卸载 类 的 实验 代码 ， 使 用 参 
数 跟踪 它 的 类 加 载 、 邯 载 情况 : 

除了 类 的 跟踪 ，JVM 还 提供 了 -XX: +PrintClassHistogram 开 关 用 于 
打印 运行 时 实例 的 信息 。 当 此 开关 被 打开 时 ， 并 且 按 下 ctrl+Break 按 
钮 ， 就 会 输出 系统 内 类 的 统计 信息 。 


-XX: +DisableExplicitGC 选 项 用 于 禁止 显示 的 GC 操作 ， 即 禁止 在 
程序 中 使 用 System.gc O 触发 的 Full GC。 通 常情 况 下 ， 开 发 人 员 应 该 
对 JVM 垃 圾 回收 机 制 有 足够 的 信任 ， 它 会 在 恰当 的 时 候 进行 垃圾 回 
收 ， 不 需要 开发 者 告诉 它 何 时 应 该 触发 。 如 果 由 于 开发 人 员 的 踢 忽 ， 
程序 中 可 能 存在 大 量 的 System.gc () 等 显示 垃圾 回收 的 代码 ， 系 统 的 
性 能 就 会 下 降 。 启 用 这 个 特性 ， 可 以 禁用 这 些 显示 GC， 提 高 性 能 。 

对 应 用 程序 来 说 ， 在 绝 大 多 数 情况 下 ， 是 不 需要 进行 类 的 回收 
的 。 因 为 回收 类 的 性 价 比 非常 低 ， 类 元 数据 一 旦 被 载 入 ， 通 常会 伴随 
应 用 程序 整个 生命 周期 ， 进 行 类 回收 很 可 能 会 无 功 而 返 。 当 然 基于 
ISGI 的 应 用 ， 或 者 使 用 动态 字 节 码 生成 技术 ， 大 量 生成 动态 类 的 应 
用 ， 这 些 除外 。 

如 果 应 用 程序 不 需要 回收 类 ， 则 可 以 使 用 -Xnoclassgc 参 数 启动 应 
用 程序 ， 那 么 在 GC 过 程 中 ， 就 不 会 发 生 类 的 回收 ， 进 而 提升 GC 的 性 
能 。 因 此 ， 如 果 读 者 尝试 使 用 -XX: +TraceClassUnloading -Xnoclassgc 
参数 运行 程序 ， 将 看 不 到 任何 输出 ， 因 为 系统 不 会 卸载 任何 类 ， 所 以 
类 外 载 是 无 法 跟踪 到 任何 信息 的 。 

参数 -Xincgc， 一 旦 启用 这 个 参数 ， 系 统 便 会 进行 增 量 式 的 GC。 增 
量 式 的 GC 使 用 特点 算法 让 GC 线 程 和 应 用 程序 线程 交叉 执行 ， 从 而 减 小 
应 用 层 序 因 GC 而 产生 的 停顿 时 间 ]。 

为 确保 class 文 件 的 正确 和 安全 ，JVM 需 要 通过 类 校 验 器 对 class 文 
件 进 行 验 证 。 目 前 ，JVM 中 有 两 套 校 验 器 。JDK1.6 默 认 开 启 了 新 的 类 
校 验 器 ， 加 速 类 的 加 载 。 可 以 使 用 -XX: -UseSplitVerifier 参 数 指定 使 用 
旧 的 类 校 验 器 。 如 果 新 的 校 验 器 校 验 失败 ， 可 以 使 用 老 的 校 验 器 再 次 
校 验 。 可 以 使 用 开关 -XX: -FailOverToOldVerifier 关 闭 再 次 校 验 的 功 
能 。 

在 Solaris 下 ，JVM 提 供 了 几 个 用 于 线程 控制 的 开关 : 

-XX: +UseBoundThreads: 绑 定 所 有 用 户 线程 到 内 核 线程 ， 减 少 线 
程 进入 饥饿 状态 的 次 数 。 

-XX: *UseLWPSynchronization: 使 用 内 核 线程 替换 线程 同步 。 

-XX: +UseVMInterruptibleIO: 人 允许 运行 时 中 断 线程 。 


对 同样 大 小 的 内 存 空间 ， 使 用 大 页 后 ， 内 存 分 页 的 表 项 就 会 减 
小 ， 从 而 可 以 提升 CPU 从 虚拟 内 存 地 址 映射 到 物理 内 存 地 址 的 能 力 。 
在 支持 大 页 的 操作 系统 中 ， 使 用 JVM 人 参数 让 虚拟 机 使 用 大 页 ， 从 而 提 
升 系统 性 能 。 

-XX: UseLargePages: 启用 大 页 

-XX: LargePageSizeInBytes: 指定 大 页 的 大 小 。 

在 64 位 虚拟 机 上 ， 应 用 程序 所 占 内 存 的 大 小 要 远 远 超出 其 32 位 版 
本 ， 约 1.5 倍 左右 。 这 是 因为 64 位 系统 拥有 更 宽 的 寻 址 空间 ， 与 32 位 系 
统 相 比 ， 指 针对 铺 的 长 度 进行 了 翻 倍 。 为 了 解决 这 个 问题 ，64 位 的 
JVM 虚 拟 机 可 以 使 用 -XX: +UseCompressedOops 参 数 打 开 指 针 压 缩 ， 
从 一 定 程度 上 减少 了 内 存 的 消耗 。 可 以 对 以 下 指针 进行 压缩 。 

m Class 的 属性 指针 (静态 成 员 变 量 ) 。 

m 对 象 的 属性 指针 。 

m 普 通 对 象 数 组 的 每 个 元 素 指 针 。 

虽然 压缩 指针 可 以 节省 内 存 ， 但 是 讨 缩 和 解 讨 指针 也 会 对 JVM 造 
成 一 定 的 性 能 损失 。 


7.4.16 查询 GC 命 令 


-verbose: 查询 GC 问题 最 常用 的 命令 之 一 ， 具 体 参 数 如 下 。 

m verbose: class: 输出 jvm 载 入 类 的 相关 信息 ， 当 jvm 报 告 说 找 不 
到 类 或 者 类 冲突 时 可 此 进行 诊断 ; 

m-verbose: gc: 输出 每 次 GC 的 相关 情况 ， 后 面 会 有 更 详细 的 介 
绍 ; 

m-verbose: jni: 输出 native 方 法 调用 的 相关 情况 ， 一 般 用 于 诊断 jni 
调用 错误 信息 。 

-Xprof: 跟踪 正 运行 的 程序 ， 并 将 跟踪 数据 在 标准 输出 输出 ; 适合 
于 开发 环境 调试 。 

-Xnoclassgc: 关闭 针对 class 的 gc 功能 ; 因为 其 阻止 内 存 回 收 ， 所 以 


可 能 会 导致 OutOfMemoryError 错 误 ; 


-Xincgc: 开启 增 量 gc (默认 为 关闭 ) ; 这 有 助 于 减少 长 时 间 GC 时 
应 用 程序 出 现 的 停顿 ;但 由 于 可 能 和 应 用 程序 并 发 执行 ， 所 以 会 降低 
CPU 对 应 用 的 处 理 能 力 。 

-Xloggc: file: 与 -verbose: gc 功能 类 似 ， 只 是 将 每 次 GC 事件 的 相 
关 情 况 记录 到 一 个 文件 中 ， 文 件 的 位 置 最 好 在 本 地 ， 以 避免 网 络 的 洪 
在 问题 。 若 与 verbose 命 令 同 时 出 现在 命令 行 中 ， 则 以 -Xloggc 为 准 。 


7.5 本 章 小 结 


本 章 首先 介绍 了 JVM 的 内 部 概念 ， 包 括 内 存 使 用 、 字 节 码 组 成 及 
使 用 、 自 动 内 存 管理 等 ， 接 下 来 介绍 了 JVM 系 统 架 构 ， 包 括 基本 染 
构 、 初 始 化 过 程 、 执 行 引 擎 方式 、JIT 编 译 器 、 类 加 载 器 等 ， 接 下 来 重 
点 介绍 了 垃圾 回收 相关 的 概念 ， 包 括 GC、 垃 圾 回收 算法 、 垃 圾 收集 器 
等 ， 最 后 是 实践 部 分 ， 针 对 JVM 的 参数 调整 进行 了 着 重 解 释 和 示例 演 
示 ， 还 对 淘宝 VM 进 行 了 一 点 介绍 。 


[H 没有 确切 的 定义 ， 多 大 叫做 大 内 存 ， 一 般 来 说 ， 以 GB 为 单位 的 对 于 JVM 来 说 都 可 以 称 之 为 大 内 存 。 
[2] 一 种 将 Java 对 象 从 Java 堆 内 移动 到 堆 外 ， 并 且 可 以 在 JVM 间 共享 这 些 对 象 的 技术 。 


[3] 发 生 在 一 个 程序 编辑 之 间 ， 在 那里 有 多 于 寄存 器 能 够 保存 的 活动 变量 。 当 一 个 编译 器 产生 机 器 代码 和 有 多 于 这 台 机 器 
已 经 寄存 的 活动 变量 时 ， 它 不 得 不 从 寄存 器 到 内 存 转换 或 “溢出 ”一 些 变量 。 


[4]4 HotSpot 在 C++ 代码 中 用 instanceOopDesc 类 来 表示 Java 对 象 ， 而 该 类 继承 oopDesc， 所 以 HotSpot 中 的 Java 对 象 也 自然 
拥有 oopDesc 所 声明 的 头 部 。 


[5]5 在 Java 中 ， 存 储 在 java.lang.ThreadLocal 中 的 变量 和 分 配 在 栈 上 的 变量 方法 内 部 的 临时 变量 等 都 属于 此 类 。 


第 8 章 其 他 优化 建议 


金融 衍生 品 (derivatives) ， 是 指 一 种 金融 合约 ， 其 价值 取决 于 一 
种 或 多 种 基础 资产 或 指数 ， 合 约 的 基本 种 类 包括 远 期 、 期 货 、 掉 期 
(Bik) 和 期 权 。 人 金融 衍生 品 还 包括 具有 远 期 、 期 货 、 掉 期 (BR) 
和 期 权 中 一 种 或 多 种 特征 的 混合 金融 工具 。 

程序 设计 的 其 他 优化 建议 就 好 比 金融 衍生 品 ， 它 本 身 不 属于 Java 基 
础 编程 技术 ， 有 些 属于 延伸 技术 ， 有 些 属于 相关 技术 。 不 论 这 些 优化 
建议 属于 具体 哪个 技术 范畴 ， 由 于 它们 都 属于 整体 系统 架构 层面 的 组 
成 部 分 ， 所 以 书 中 会 进行 有 针对 性 的 讨论 。 

本 章 主 要 介绍 和 解决 以 下 问题 ， 这 也 是 本 书 的 收 官 篇 章 : 

m Java 整 体 发 展 过 程 及 未 来 思路 。 

E 系统 架构 方面 调 优 思路 分 享 。 

m Java 项 目 优 化 方式 分 享 。 

m 面向 服务 思维 及 资源 隔离 计数 分 享 。 

m 团队 并 行 开 发 经 验 分 享 。 

m 工程 师 性 格 养 成 。 


8.1 Java 现 有 机 制 及 未 来 发 展 


8.1.1 Java 体 系 结构 变化 历史 


通过 20 年 的 发 展 ，Java 已 由 一 门 单纯 的 计算 机 编程 语言 ， 逐 渐 演 变 
为 一 套 强 大 的 技术 体系 平台 。 根 据 不 同 的 技术 规范 ，Java 设 计 者 们 将 
Java 划 分 为 3 种 结构 独立 但 却 又 彼此 依赖 的 技术 体系 分 支 ， 分 别 是 Java 
SE. Java EE 和 Java ME， 其 中 Java EE 被 广泛 使 用 在 企业 级 领域 ， 除 了 
包括 Java API 组 件 外 ， 还 扩充 有 Web 组 件 、 事 务 组 件 、 分 布 式 组 件 、 
EJB 组 件 、 消 息 组 件 等 ， 整 个 体系 框架 在 不 断 地 扩大 。 总 的 来 说 ，Java 
EE 也 是 被 发 展 得 最 好 的 。 综 合 Java EE 的 这 些 技 术 ， 开 发 人 员 可 以 构建 


出 一 个 具备 高 性 能 、 结 构 严 说 的 企业 级 应 用 ， 并 且 Java EE 也 是 用 于 构 
建 SOA[1] 架 构 的 首选 平台 。 

对 于 一 种 有 着 悠久 历史 的 编程 语言 来 说 ， 其 历史 发 展 过 程 本 身 既 
是 一 种 财富 ， 也 是 一 种 负担 。 庞 大 的 开发 者 社区 为 这 门 语言 的 演化 提 
供 了 坚实 的 用 户 基础 ， 也 为 这 门 语言 贡献 了 非常 多 的 可 复 用 的 资产 。 
从 另外 一 方面 来 说 ， 必 须 保持 的 后 向 兼容 性 也 使 得 Java 语 言 在 应 对 变化 
时 显得 力不从心 。 当 Ruby 程 序 员 可 以 把 基本 类 型 ， 如 整数 和 浮 点 数 ， 
当 作 功能 完备 的 对 象 来 使 用 时 ， 在 Java 世 界 中 ， 基 本 类 型 和 对 象 还 是 分 
开 的 。Java 程 序 员 享受 不 到 Ruby 中 3.next 和 5.times 那 样 简洁 易 用 的 语 
法 。 虽 然 Java SE5.0 引 入 了 基本 类 型 的 自动 装 箱 和 拆 箱 机 制 ， 缓 解 了 这 
个 问题 ， 但 是 依然 无 法 实现 Ruby 那 样 的 灵活 性 。 当 然 ，Java 语 言 在 最 
初 设 计 的 时 候 ， 肯 定 权 衡 了 各 种 选择 的 优 缺 点 ， 做 出 了 当时 最 合理 的 
设计 选择 。 通 过 了 解 一 门 编程 语言 的 历史 ， 可 以 深刻 理解 其 发 展 过 程 
中 各 种 变化 背后 的 动机 。 

总 的 来 说 ，Java 的 持续 发 展 要 感谢 Google[2]， 正 是 Google 将 Java 作 
为 Android[3] 操 作 系 统 的 应 用 层 编程 语言 ， 使 得 Java 可 以 在 PC 时 代 、 移 
动 互联 网 时 代 都 得 到 迅猛 发 展 ， 可 以 被 广泛 用 于 手持 移动 设备 、 主 入 
式 设 备 、 个 人 电脑 、 高 性 能 的 集群 服务 器 或 大 型 机 。 

近 几 年 来 ，Java 模 式 化 一 直 是 一 个 比较 活跃 的 话题 。 所 谓 模块 化 指 
的 是 开发 人 员 在 构建 大 型 系统 时 ， 能 够 将 系统 中 的 每 一 个 功能 模块 进 
行 独立 的 开发 和 物理 部 署 ， 这 样 做 的 优点 不 仅 能 够 有 效 降 低 各 个 业务 
模块 之 间 的 耦合 ， 同 时 还 能 够 保证 当 单 一 模块 发 生 故 障 的 时 候 不 会 影 
响 系 统 整体 的 运行 。 当 然 模 块 化 本 身 只 是 一 种 概念 ， 其 目的 就 是 为 了 
将 系统 中 原本 耦合 的 逻辑 机 型 分 解 ， 以 此 满足 各 个 模块 之 间 的 独立 ， 
并 定义 一 种 标准 化 的 接口 [ 颖 契约 来 进行 相互 之 间 的 通信 。 尽 管 Java 目 
前 并 没有 在 JDK 中 内 置 模块 化 编程 技术 (预计 JDK9[5] 会 推出 ) ， 但 这 
似乎 并 不 能 阻挡 开发 人 员 选 用 OSGi 技 术 作 为 首先 来 完成 模块 化 编程 。 
早 在 2007 年 的 时 候 ， 由 Sun 公 司 主导 并 提交 的 JSR-277[6] 规 范 并 没有 通 
过 JCP[7] 组 织 的 审核 ， 这 主要 是 由 于 JCP 专 家 组 织 通 过 投票 将 IBM 公 司 
提交 的 JSR-291 (OSGiR4.1) 纳入 了 Java 模 块 化 规范 标准 。 直 到 Sun 公 
司 在 Java7 早 期 时 ， 再 次 提交 JSR-294 (Java 模 块 化 系统 的 改进 支持 ) 规 
范 ， 可 惜 最 终 还 是 未 能 如 愿 。 不 得 已 Sun 公 司 只 能 够 避 开 JCP 组 织 ， 在 
OpenJDK 中 创建 了 一 个 叫 作 Jigsaw 的 子 项 目 来 实现 Java 模 块 化 编程 技 


术 ， 但 该 项 目 却 因为 一 些 原因 被 迫 延 期 到 Java9 中 进行 发 布 。 不 管 技术 
如 何 发 展 ， 我 们 可 以 断定 OSGi 技 术 会 使 Java 模 块 化 规范 标准 。 

纵 观 Java 语 言 的 发 展 历史 。 

1991 年 James Gosling[8]. Mike Sheridan $f Patrick Naughton[9] 在 
Sun 公 司 开 始 了 一 种 新 的 编程 语言 的 设计 和 开发 工作 。 这 种 新 的 语言 
过 好 几 个 名 字 ， 从 最 初 的 Oak 到 后 来 的 Green ， 直 到 最 后 被 定名 为 Javao 
在 最 初 的 时 候 ， 这 门 语言 是 以 与 计算 机 相连 接 的 智能 消费 电子 产品 作 
为 目标 平台 而 设计 的 。Java 语 言 最 早 运行 在 数字 有 线 电 视 的 控制 器 上 ， 
不 过 ， 这 项 技术 对 当时 的 产业 来 说 过 于 超前 了 。 正 当 发 展 遇 到 瓶颈 的 
时 候 ， 幸 运 的 是 ，Java 赶 上 了 从 1995 年 开始 的 互联 网 发 展 的 上 升 期 。 
1995 年 底 ，Sun 公 司 正 式 发 布 Java 语 言 。 在 随后 不 久 的 1996 年 初 ， 
JDK1.0 发 布 。 当 时 Java 语 言 的 杀手 级 应 用 是 Java Applet。 当 时 主流 的 浏 
览 器 都 支持 Applet。 在 当时 ，HTML 语 言 所 能 提供 的 交互 性 能 力 还 比较 
弱 ， 而 用 户 对 于 互联 网 应 用 的 热情 却 非常 高 涨 ， 这 就 在 Web 应 用 的 交互 
能 力 和 用 户 的 需求 之 间 产 生 了 一 个 缺口 。Java Applet 的 出 现 正好 填补 了 
这 个 空白 。Applet 提 供 了 丰富 的 用 户 界 面 组 件 ， 以 及 2D 图 形 绘制 能 
力 ， 其 所 提供 的 交互 性 体验 远 优 于 当时 的 HIML ， 因 此 Java Applet 得 到 
了 广泛 流行 。Java Applet 的 代码 是 从 远程 服务 器 上 下 载 到 用 户 的 本 地 浏 
览 器 中 来 运行 的 。 这 种 需求 催生 了 Java 语 言 的 一 个 重要 特性 ， 就 是 类 加 
载 其 。 动 态 类 加 载 的 概念 被 认为 是 Java 语 言 唯一 的 重要 创新 。 

在 JDK1.0 之 后 ，JDK1.1 于 1997 年 发 布 。 在 这 个 版 本 中 ， 一 些 新 特 
性 被 加 入 进来 ， 包 括 内 部 类 、JavaBeans、JDBC、RMI 和 反射 等 。 
JDK1.1 发 布 三 个 星期 之 后 ， 就 达到 了 22 万 的 下 载 量 。 

从 JDK1.1 开 始 ，Java 为 不 同 的 目标 平台 提供 了 不 同 的 配置 ， 这 就 是 
标准 版 、 企 业 版 和 移动 版 。Sun 公 司 也 启用 了 Java2 这 样 一 个 新 名 称 。 这 
些 不 同 的 配置 也 被 对 应 地 称 为 Java2 标 准 版 (J2SE) 、Java? 企 业 版 

(J2EE) 、Java2 移 动 版 (J2ME) 。J2SE1.2 于 1998 年 发 布 ， 其 中 最 重 
要 的 更 新 是 添加 了 Swing 用 户 界面 库 和 集合 类 框架 。Swing 用 户 界面 的 
引入 ， 使 Java 在 桌面 应 用 开发 中 占据 了 一 席 之 地 。 而 Java 的 集合 类 框架 
则 一 直 被 认为 是 架构 和 API 设 计 的 良好 典范 ， 其 主要 设计 和 开发 者 是 
(Effective Java) 的 作者 Joshua Bloch[10]。 


Java2 的 版 本 更 新 以 较 快 的 速度 进行 。2000 年 发 布 的 J2SE1.3 中 最 重 
要 的 改进 是 使 用 HotSpot 作 为 默认 的 Java 虚 拟 机 ， 极 大 地 提升 了 Java 程 
序 的 运行 性 能 ， 在 一 定 程度 上 缓解 了 一 直 以 来 为 开发 者 所 诉 病 的 性 能 
问题 。 动 态 代 理 机 制 也 在 这 个 版 本 中 被 印 日 ， 人 允许 以 简单 的 方式 来 实 
现 面向 方面 编程 (AOP) o 

随 着 Java 语 言 的 不 断 发 展 和 流行 ， 对 Java 平 台 的 需求 也 日 益 增 多 。 
如 何 让 Java 语 言 健康 有 序 地 发 展 ， 成 为 Sun 公 司 需要 解决 的 一 个 问题 。 
Sun 公 司 尝 试 向 国际 标准 化 组 织 靠 扰 ， 以 寻求 Java 语 言 的 标准 化 。 后 来 
Sun 公 司 放 弃 了 这 种 努力 ， 转 而 拥抱 广大 的 开发 者 社区 ， 采 用 社区 驱动 
的 方式 来 促进 Java 语 言 的 发 展 。1998 年 ，Java 程 序 社区 (Java 
Community Process，JCP) 成 立 ， 其 中 包含 了 对 Java 感 兴趣 的 公司 、 研 
究 机 构 和 个 人 。 对 Java 平 台 的 改进 都 通过 JCP 来 运作 。 对 Java 平 台所 做 
的 每 一 个 修改 都 以 Java 规 范 请 求 (Java Specification Request, JSR) 的 
形式 来 提交 给 JCP 进 行 审阅 和 批准 ， 最 终 成 为 Java 平 台 的 一 部 分 。 

2002 年 ， 首 个 采用 JCP 方 式 开发 的 Java 平 台 J2SE1.4 发 布 。 在 这 个 版 
本 中 ， 更 多 的 类 库 被 加 入 进来 ， 包 括 正 则 表达 式 、 非 阻塞 7O 

(NIO) 、 日 志 记录 API、XML 和 XSLT 支 持 以 及 安全 和 加 密 功能 等 。 

2004 年 发 布 的 J2SE5.0 是 Java 语 言 发 展 历 史上 的 一 个 重要 的 版 本 。 
在 这 个 版 本 中 ，Java 增 加 了 很 多 语法 上 的 新 特性 ， 包 括 泛 型 支持 、 注 
解 、 基 本 类 型 的 自动 装 箱 和 拆 箱 、 枚 举 类 型 、 参 数 长 度 可 变 的 方法 、 
增强 的 for 循 环 和 静态 引入 等 。 而 在 类 库 方面 ， 并 发 实用 类 库 
java.util.concurrent 的 引入 ， 极 大 地 降低 了 并 发 应 用 开发 的 复杂 度 。 在 
Java5 版 本 的 时 候 ，Java 设 计 者 们 通过 JSR-166 的 规范 制定 ， 在 
java.utilconcurrent 包 下 为 开发 人 员 提供 了 基于 粗 粒 度 的 多 核 并 行 计算 框 
架 ， 只 不 过 这 种 基于 粗 粒 度 的 并 行 计 算 模式 ， 并 不 能 在 处 理 效 率 上 达 
到 令 人 满意 的 程度 。 因 为 这 种 基于 粗 粒 度 的 并 行 计 算 ， 根 本 无 法 高 效 
组 合 所 有 可 用 物理 核心 一 起 进行 并 行 任 务 处理 ， 甚 至 在 某 些 情况 下 ， 
还 有 可 能 导致 部 分 物理 核心 处 于 空 内 的 状态 。 所 以 Java7 在 
java.util.concurrent.firkjoin 包 下 新 增 了 基于 细 粒 度 的 多 核 并 行 计算 
Fork/Join 框 架 。 该 框架 的 设计 初衷 是 将 一 个 任务 量化 到 最 小 ， 并 提供 高 
计算 密度 的 并 行 处 理性 能 。 简 单 来 说 ， 我 们 可 以 将 一 个 任务 拆 分 成 若 
干 个 子 任务 ， 直 到 这 个 任务 足够 小 ， 然 后 每 一 个 子 任务 被 独立 并 行 计 
算 ， 直 到 任务 执行 完成 ， 再 将 其 逐个 合并 为 一 个 完整 的 任务 ， 这 就 是 


Fork/Join 框 架 提 供 的 细 粒 度 并 行 计 算 模 式 ， 我 们 在 第 5 章 已 经 详细 介绍 
fo 

Java SE6 于 2006 年 发 布 ， 这 个 版 本 的 新 特性 主要 体现 在 对 脚本 语言 
的 支持 、Java 编 译 器 API 和 可 插 拔 式 注 解 等 方面 。Java SE6 另 一 个 重要 
提升 是 在 性 能 方面 ， 包 括 核 心平 台 和 Swing 用 户 界 面 库 的 性 能 都 有 了 很 
大 的 提升 。 在 正式 版 本 发 布 之 后 ， 每 隔 一 段 时 间 就 会 有 很 小 的 更 新 修 
订 版 本 发 布 。 

除了 Java7 能 够 高 效 地 利用 Fork/Join 框 架 实 现 多 核 并 行 计算 外 ， 开 
源 基金 会 Apache 提 供 的 Hadoop MapReduce 框 架 也 是 一 个 高 效 的 海量 数 
据 计 算 框架 ， 它 允许 开发 人 员 将 其 部 署 在 廉价 的 集群 服务 器 上 处 理 TB 
级 别 的 数据 。 当 然 还 有 一 些 编程 语言 自 诞 生 那 天 起 ， 就 是 为 了 解决 并 
行 计算 而 来 ， 比 如 Scala、Clojure 和 Erlang 等 。 这 类 编程 语言 ， 不 仅 继 承 
了 面向 对 象 的 特性 ， 同 时 还 结合 了 函数 式 编程 [241] 等 特性 。 虽 然 目前 
Java 同样 也 可 能 够 使 用 函数 式 编 程 ， 但 代码 将 会 显得 非常 元 余 ， 不 过 
Java 设 计 者 们 在 Java8 种 提供 对 Lambda 的 支持 ， 这 极 大 地 改善 了 Java 对 
于 函数 式 编程 的 不 足 。 

Java7 提 出 了 全 新 的 文件 系统 NIO2.0， 利 用 NIO2.0， 开 发 人 员 无 须 
关注 IO 细节 ， 因 为 新 文件 系统 中 封装 有 大 量 的 通用 操作 ， 便 于 开发 人 
员 更 好 地 关注 自身 业务 。 并 且 在 IO 模型 方面 ， 将 支持 调用 操作 系统 的 
IOCP (Input/Output Completion Port， 输 入 /输出 完成 端口 ) 接口 实现 真 
正 的 异步 JO0， 尽 可 能 避免 因 IO 问 题 导 致 的 系统 瓶颈 出 现 。 

Java 不 断 发 展 的 过 程 中 ， 操 作 系 统 也 在 不 断 地 发 展 。 相 对 于 传统 的 
32 位 虚拟 机 ，64 位 虚拟 机 所 具备 的 最 大 优势 就 是 可 以 访问 大 内 存 ，32 
位 虚拟 机 做 的 最 大 可 用 内 存 空间 被 限定 在 了 AGB, ， 并 且 Java 扒 区 的 大 
小 如 果 是 在 Windows 平 台 下 最 大 只 能 设置 到 1.5GB， 而 在 Linux 平 台 下 最 
大 也 只 能 设置 到 2GB-3GB 的 上 限 ， 也 就 是 说 ，Java 扒 区 的 内 存 大 小 设 
置 还 需要 依赖 于 具体 的 操作 平台 。 既 然 32 位 虚拟 机 无 法 满足 大 内 存 消 
耗 的 应 用 场景 ， 那 么 64 位 虚拟 机 的 出 现 则 是 顺理成章 的 ，64 位 虚拟 机 
之 所 以 能 够 访问 大 内 存 ， 是 因为 其 采用 了 64 位 的 指针 架构 ， 这 也 是 寻 
址 访问 大 内 存 的 关键 要 素 。 

在 JDK1.6 Update14 版 本 之 前 ，64 位 虚拟 机 的 综合 性 能 表现 实际 上 
是 不 如 32 位 虚拟 机 的 ， 这 主要 是 因为 OOPS (Ordinary Object Pointers， 


普通 对 象 指 针 ) 从 32 位 膨胀 到 64 位 后 ，CPU Cache Line 中 的 可 用 OOPS 
变 少 ， 这 样 一 来 就 会 直接 影响 并 降低 CPU 的 缓存 使 用 率 ， 这 就 是 64 位 
虚拟 机 在 性 能 上 之 所 以 落后 于 32 位 虚拟 机 的 主要 原因 。 其 次 由 于 部 署 
在 64 位 虚拟 机 上 的 性 能 都 需要 用 到 大 内 存 ， 尤 其 是 互联 网 项 目 ， 经 常 
需要 使 用 多 达 几 十 乃至 几 百 GB 的 内 存 ， 这 对 于 传统 的 32 位 虚拟 机 将 无 
法 承载 ， 只 能 依靠 64 位 虚拟 机 去 支撑 。 但 是 管理 这 么 大 的 内 存 开 销 对 
于 GC 来 说 将 会 是 一 场 非常 严峻 的 考验 ， 甚 至 很 有 可 能 去 导致 GC 在 执行 
内 存 回收 期 间 消耗 更 长 的 时 间 ， 同 时 也 意味 着 工作 线程 的 等 待 时 间 将 
会 延长 。 随 着 如 今 64 位 虚拟 机 的 逐渐 成 熟 ， 指 针 压 缩 将 会 通过 对 齐 补 
白 等 操作 将 64 位 指针 压缩 为 32 位 ， 以 此 改善 CPU 缓存 使 用 率 达 到 提升 
64 位 虚拟 机 运行 性 能 的 目的 。 

淘宝 的 技术 团队 对 Java 虚 拟 机 的 优化 工作 其 实 早已 不 是 停留 在 简单 
的 参数 调整 上 面 ， 而 是 充分 结合 了 企业 自身 的 业务 特点 以 及 实际 的 应 
用 场景 ， 在 OpenJDK 的 基础 之 上 通过 修改 大 量 的 HotSpot 源 人 代码， 深度 
定制 了 淘宝 专属 的 高 性 能 Linux 虚 拟 机 TAOBAOVM。 从 严格 意义 上 来 
说 ， 在 提升 Java 虚 拟 机 性 能 的 同时 ， 严 重 依 赖 于 物理 CPU 类 型 。 也 就 是 
说 ， 部 署 有 TAOBAOVM 的 服务 器 中 ，CPU 全 都 是 清一色 的 Intel CPU, 
且 编 译 手 段 采 用 的 是 Intel C/CPP Compiler 进 行 编 译 ， 以 此 对 GC 性 能 进 
行 提 升 。 除 了 优化 编译 效果 外 ，TAOBAOVM 还 使 用 crc32 指 令 实 现 
JVM intrinsic 降 低 JNI 的 调用 开销 。 

除了 在 性 能 优化 方面 下 足 了 功夫 ，TAOBAOVM 还 在 HotSpot 的 基 
础 之 上 大 幅度 扩充 了 一 些 特定 的 增强 实现 ， 比 如 创新 的 GCIH (GC 
invisible heap) 技术 实现 off-heap， 这 样 一 来 就 可 以 将 生命 周期 较 长 的 
Java 对 象 从 heap 中 移 至 heap 之 外 ， 并 且 GC 不 能 管理 GCIH 内 部 的 Java 对 
象 ， 这 样 做 最 大 的 好 处 就 是 降低 了 GC 的 回收 频率 以 及 提升 了 GC 的 回收 
效率 ， 并 且 GCIH 中 的 对 象 还 能 够 在 多 个 Java 虚 拟 机 进程 中 实现 共享 。 
其 他 补充 技术 还 有 利用 PMU hardware 的 Java profiling tool 和 诊断 协助 功 
能 等 。 


8.1.2 Java 语 言 面临 的 挑战 


随 着 各 种 新 的 需求 和 应 用 场景 的 不 断 出 现 ， 新 的 软件 开发 思想 和 
程序 设计 语言 也 层出不穷 。 虽 然 Java 语 言 多 年 来 一 直 稳 坐 编 程 语言 排行 


榜 的 头 把 交椅 ， 但 是 它 近 年 来 也 面临 着 其 他 语言 的 冲击 。 各 种 唱 衰 Java 
的 悲观 论调 在 社区 里 此 起 彼 伏 。Java 是 静态 强 类 型 语言 。 这 种 特性 使 
Java 编 译 器 在 编译 时 可 以 发 现 非常 多 的 类 型 错误 ， 而 不 会 让 这 些 错误 在 
运行 时 才 暴 露出 来 。 对 于 构建 一 个 稳定 而 安全 的 应 用 来 说 ， 这 是 一 个 
很 大 的 优势 ， 但 是 这 种 静态 的 类 型 检查 也 限制 了 开发 人 员 编 写 代 码 时 
的 创造 性 和 灵活 性 。 

首先 是 因为 互联 网 的 发 展 带 来 的 各 种 动态 语言 ， 动 态 语 言 的 灵活 
性 带 来 了 开发 效率 的 极 大 提升 ，Java 语言 的 静态 类 型 特点 限制 了 开发 
人 员 编 码 时 的 创造 性 与 灵活 性 ; 其 次 是 Groovy[12]. Scala[13]. 
JRuby[14] 等 运行 在 Java 虚拟 机 上 的 语言 ， 它 们 既 有 简洁 优雅 的 语法 ， 
又 能 充分 利用 Java 虚 拟 机 的 资源 ， 极 具 竞 争 力 ， 再 者 ，Java 在 云 计算 时 
代 也 面临 以 Go 语言 [15] 为 主 的 容器 (Docker[16] 等 技术 ) 生态 圈 的 挑 
战 。 

Web2.0 概 念 的 出 现 和 互联 网 应 用 的 火热 ， 为 新 语言 的 流行 创造 了 
契机 。Ruby[17] 语 言 凭 借 Ruby on Rails 一 举 走红 ，Google 的 Web 应 用 开 
发 平台 Google App Engine 最 初 也 只 支持 Python[18] 一 种 语言 ， 甚 至 流行 
的 JavaScript 语 言 也 借助 于 Node.js[19] 和 Jaxer[20] 等 平台 在 服务 器 端 开发 
中 占据 了 一 席 之 地 。 这 些 语言 的 共同 特征 是 代码 动态 型 与 拥有 灵活 自 
由 的 语法 。 开 发 人 员 一 旦 掌握 了 这 些 语言 ， 开 发 效率 会 非常 的 高 。 在 
这 一 点 上 ，Java 语 言 纷 繁 的 语法 就 显得 缺乏 吸引 力 。Java 语 言 也 受到 同 
样 运行 在 Java 虚 拟 机 上 的 其 他 语言 的 挑战 。 这 些 语言 包括 Groovy、 
Scala、JRuby 和 和 Jython 等。 任何 语言 ， 只 要 它 生 成 的 字 节 代码 符合 Java 
字 节 代码 规范 ， 就 可 以 在 Java 虚 拟 机 上 运行 。 前 面 提 到 的 这 些 Java 虚 拟 
机 上 的 语言 既 具 有 简洁 优雅 的 语法 ， 又 能 充分 利用 已 有 的 Java 虚 拟 机 资 
源 ， 相 对 于 Java 语 言 本 身 而 言 ， 非 常 具有 竞争 力 。 

Java 平 台 的 不 足 之 处 是 整个 Java 平 台 的 复杂 性 。 最 早 在 JDK1.0 发 布 
的 时 候 只 有 几 百 个 Java 类 ， 而 到 Java6 时 ， 已 经 包括 Java SE. Java EE 和 
Java ME 等 多 个 版 本 ， 所 包含 的 Java 类 多 达 数 千 个 。 对 于 普通 开发 者 来 
说 ， 完 全 理解 和 熟悉 如 此 庞大 的 难度 非常 大 。 在 日 常 的 开发 过 程 中 ， 
经 常 可 以 看 到 开发 者 在 重复 实现 某 些 功能 ， 而 这 些 功能 在 Java 类 库 中 已 
经 存在 ， 只 是 不 被 人 知道 而 已 。 除 了 庞大 的 类 库 之 外 ，Java 语言 的 语 
法 本 身 也 缺乏 足够 的 灵活 性 ， 实 现 某 些 功 能 所 需 的 代码 量 可 能 是 其 他 
语言 的 几 倍 。 另 外 一 个 复杂 性 体现 在 Web 应 用 开发 方面 。 一 个 完整 的 


Java EE 应 用 程序 要 求 程 序 员 掌握 和 理解 的 概念 太 多 ， 要 使 用 的 库 也 非 
常 多 ， 过 去 管理 整个 Java EE 应 用 程序 相关 库 文件 的 方式 非常 复杂 ， 需 
要 自己 建立 文件 夹 专门 用 来 存储 类 库 文 件 ， 后 来 出 现 了 ANT[21] 和 
Maven[22]， 开 始 慢 慢 让 管理 变 得 容易 起 来 了 。 这 一 点 我 们 从 市 面 上 到 
处 可 见 的 以 Java Web 应 用 开发 和 Struts、Spring、Hibernate 等 框架 为 内 
容 的 图 书 上 就 可 以 看 出 来 。 虽 然 新 出 现 的 Grails 和 Play 框架 等 都 试图 降 
低 这 个 复杂 度 ， 但 是 这 些 新 的 框架 的 流行 仍然 需要 足够 长 的 时 间 。 

其 实 JVM 也 是 一 种 容器 ， 但 是 这 种 容器 特性 正在 被 Linux 学 习 与 赶 
E, ABA, JVM ELMA Betb. Dockerz 25$ 8s n] DATE AHO 
笔记 本 或 电脑 上 运行 ， 然 后 同样 可 以 部 署 到 云 上 运行 。 当 在 云 上 运行 
时 ，Kubernetes[23] 能 够 以 一 种 可 控 的 方式 升级 容器 从 而 实现 运行 管理 
一 批 容 器 ， 如 同一 个 大 型 船 队 或 舰队 一 样 ， 你 可 以 控制 它们 的 流量 访 
问 量 ， 可 以 指定 多 少 个 容器 来 扩展 支撑 一 个 服务 的 运行 ， 随 着 访问 量 
提升 ， 你 通过 增加 容器 数量 能 够 整个 系统 的 负载 能 力 。 

当然 ，Java 的 大 型 分 布 式 系统 越 来 越 多 ，Java 在 云 计 算 与 分 布 式 系 
统 中 还 是 扮演 主要 角色 ， 形 成 一 个 大 型 的 生态 圈 。 当 我 们 站 在 泰山 之 
E, 一 览 众 山 小 ， 当 你 在 全 球 拥有 多 个 数据 中 心 时 ， 语 言 已 经 变 得 不 
那么 重要 了 ， 关 键 是 架构 设计 。 

Go 语言 相对 Java 来 说 ， 主 要 优点 是 其 并 发 组 件 模 型 ，Java 的 并 发 比 
较 低 级 ， 无 非 是 多 线程 与 锁 ， 想 搞 清 楚 Java 中 各 种 锁 的 用 途 ， 包 括 数据 

合 Collection 的 线程 安全 性 与 性 能 差异 对 比 ， 需 要 花费 大 量 时 间 与 精 
力 ， 包 括 具 体 的 使 用 经 验 。 而 Go 语言 使 用 了 Channel/CEP 这 样 的 组 件 简 
单 封 鞘 了 多 线程 与 锁 ， 将 以 前 JMS 的 Queue 队 列 模 型 架构 引入 到 了 语言 
之 中 ， 两 个 对 象 之 间 交 互 只 要 通过 Channel 通 道 就 可 以 。 这 种 模型 保证 
了 并 发 性 ， 又 简化 了 编程 模型 ， 无 疑 受到 很 多 人 的 欢迎 。 

Go 语言 当前 也 受到 更 加 强劲 的 Rust[24] 语 言 挑战 ， 如 果 说 ，Go 语 
言 的 Channel 是 一 种 有 形 的 设计 ， 那 么 ，Rust 语言 的 并 发 模型 达到 无 形 
的 设计 ， 只 要 你 编写 好 函数 方法 ， 安 全 性 与 并 发 性 就 无 形 中 得 到 了 解 
决 ， 不 用 专门 去 思考 并 发 ， 有 意识 地 去 使 用 并 发 组 件 模型 编程 。 现 在 
的 开发 语言 如 十 后 春笋， 主要 原因 是 CPU 进入 多 核 并 发 时 代 ， 以 及 大 
型 架构 进入 分 布 式 系统 ， 如 何 使 用 一 种 语言 从 微观 的 CPU 多 核 之 间 并 
发 到 数 万 台 服 务 器 之 间 的 分 布 式 计 算 处 理 ， 这 种 大 一 统 的 愿景 促使 人 


们 在 不 断 探索 。 在 Java 中 ， 我 们 可 以 通过 框架 来 实现 这 点 ， 以 Jdon 框 架 
为 例 ， 虽 然 能 够 勉强 实现 并 发 与 分 布 式 ,但 是 这 种 实现 需要 很 强 的 知 
识 背景 ， 不 利于 初学 者 上 手 。 而 要 达到 普及 这 个 目标 ， 必 须 从 语言 
手 ， 让 语言 初学 者 在 学 习 掌 握 语言 以 后 ， 无 形 中 就 会 实现 了 并 发 与 分 
布 式 。 

Go 语言 在 这 方面 比较 突出 ， 其 并 发 模型 以 读 写 操作 为 基础 。 请 注 
意 ，Java 等 语言 并 发 模型 没有 这 么 高 ， 它 们 是 以 线程 为 基础 ， 再 应 用 到 
读 写 场景 中 ， 而 我 们 现实 中 必须 以 读 写 为 基础 ， 再 应 用 到 具体 业务 场 
景 中 ， 这 里 面 高 低层 次 : 线程 - > 读 写 操作 - > 业务 应 用 ， 无 疑 越 靠近 业 
务 应 用 的 语言 越 能 简化 我 们 的 开发 ， 而 分 布 式 系统 也 是 基于 读 写 操 
作 ， 著 名 的 CAP 定 理 也 隐 含 了 以 读 写 操作 为 基础 的 语 境 。 


8.1.3 Java8 的 新 特性 


除了 Lambda 表 达 式 和 模块 化 支持 之 外 ，Java SE8 种 的 其 他 更 新 内 
容 包 括 : 

m 把 JRockit 虚 拟 机 中 的 部 分 特性 整合 到 HotSpot 虚 拟 机 中 ， 提 供 一 
个 统一 的 虚拟 机 实现 ; 

m 集 成 JavaFX3.0。 在 Java SE8 中 会 直接 集成 JavaFX3.0; 

m 在 虚拟 机 上 可 以 直接 使 用 新 的 JavScript 引 和 擎 ， 以 及 更 好 的 
JavScript 和 Java 人 代码 之 间 的 互 操作 性 。 新 的 JavaScript 引 擎 被 称 为 
Nashorn， 是 一 个 基于 JSR292 的 实现 ; 

在 移动 设备 商 ， 增 加 对 多 点 触 控 、 摄 像 头 、 地 理 位 置信 息 、 罗 盘 
和 重力 加 速 器 的 支持 ; 

m 对 Java 安 全 、 网 络 、 国 际 化 和 可 访问 性 API 的 更 新 ; 

m 允许 Java 中 的 注解 出 现在 类 型 的 任意 使 用 方式 上 ， 而 不 仅 限 于 类 
型 、 方 法 、 域 和 变量 的 声明 中 。 注 解 可 以 使 用 的 位 置 包 括 方 法 调用 的 
接收 者 、 泛 型 类 型 参数 、 数 组 、 强 制 类 型 转换 、instanceof 操 作 符 、 对 
象 创 建 、 泛 型 中 类 型 参数 的 上 界 和 下 界 、 类 继承 关系 和 throws 子 句 。 具 
体 的 细节 由 JSR308 (Annotations on Java Types) 规范 来 描述 ; 

m 新 的 日 期 和 时 间 API， 用 来 解决 当前 使 用 javautil.Date 类 和 
java.util.Calendar 类 处 理 日 期 和 时 间 中 产生 的 问题 。 有 具体 的 细节 由 


JSR310 (Date and Time API) 规范 来 描述 。 


E 


8.1.4 Java 语 言 前 景 


Java 平 台 正 沿 着 三 个 重要 方向 发 展 : 

第 一 ， 提 高 开发 人 员 的 生产 效率 ， 尽 可 能 在 保证 健壮 性 的 同时 降 
低语 法 的 复杂 度 。 由 于 Java 语 言 的 静态 强 类 型 特性 ， 使 用 Java 语 言 编写 
的 程序 代码 一 半 比 较 烦 琐 ， 包 含 了 过 多 不 必要 的 语法 元 素 ， 这 在 一 定 
程度 上 降低 了 开发 人 员 的 生产 效率 。 大 量 的 时 间 被 瀛 费 在 语言 本 身 
上 ， 而 不 是 真正 需要 的 业务 逻辑 上 。 从 另外 一 个 角度 来 说 ，Java 语言 
的 这 种 严谨 性 ， 对 于 复杂 应 用 的 团队 开发 是 大 有 好 处 的 。 有 利于 构建 
健壮 的 应 用 。Java 语 言 需 要 在 这 两 者 之 间 达 到 一 个 平衡 。Java 语 言 的 一 
个 发 展 趋 势 是 在 可 能 的 范围 内 降低 语言 本 身 的 语法 复杂 度 。 从 J2SE 5.0 
种 增强 的 for 循 环 ， 到 Java7 的 try-with-resources 语 句 和 < > 操作 符 ， 再 到 
Java8 引 入 的 Lambda 表 达 式 ，Java 正 在 不 断 地 简化 自身 的 语法 。 

第 二 ， 提 高 平台 的 性 能 ， 新 的 Java 技 术 要 能 让 Java 应 用 充分 利用 硬 
件 升级 〈 多 核 CPU 和 多 CPU 架构 ) 所 带 来 的 性 能 提升 。Java 平 台 的 性 能 
一 直 为 开发 人 员 所 诉 病 ， 这 主要 是 因为 Java 虚 拟 机 这 个 中 间 层 次 的 存 
在 。 随 着 硬件 技术 的 发 展 ， 越 来 越 多 的 硬件 平台 采用 了 多 核 CPU 和 多 
CPU 的 架构 。 应 用 程序 应 该 充分 利用 这 些 资 源 来 提高 程序 的 运行 性 
能 。Java 平 台 需 要 帮助 开发 人 员 更 好 地 实现 这 个 目标 。Java7 中 的 
forkjoin 框 架 是 一 个 高 效 的 任务 执行 框架 。Java8 对 集合 类 框架 和 相关 
API 做 了 增强 ， 以 支持 对 批量 数据 进行 自动 的 并 行 处 理 。 

第 三 ， 模 块 化 ， 通 过 把 Java 平 台 提供 的 类 库 划 分 为 相互 依赖 的 不 同 
模块 ， 不 仅 可 以 提升 程序 员 的 开发 效率 ， 而 且 还 能 提升 应 用 的 运行 速 
度 。 一 直 以 来 ，Java 平 台所 包含 的 各 种 功能 不 同 的 类 库 是 一 个 统一 的 整 
体 。 在 一 个 程序 的 运行 过 程 中 ， 很 多 类 库 其 实 是 不 需要 的 。 比 如 对 于 
一 个 服务 器 端 运 行 的 程序 来 说 ，Swing 用 户 界 面 组 件 库 通 常 是 不 需要 
的 。 模 块 化 的 含义 是 把 Java 平 台 提 供 的 类 库 划 分 成 不 同 的 相互 依赖 的 模 
块 ， 程 序 可 以 根据 需要 选择 运行 时 所 依赖 的 模块 ， 只 有 被 选择 的 模块 
才 会 在 运行 时 被 加 载 。 模 块 化 的 实现 不 仅 可 以 应 用 到 Java 平 台 本 身 ， 也 
可 以 应 用 到 Java 应 用 程序 的 开发 中 ，OpenJDK 中 的 Jigsaw 项 目 提供 了 这 
种 模块 化 的 支持 ， 未 来 在 Java9 中 Osgi 会 负责 提供 这 样 的 模块 化 支持 。 


对 于 Java 语 言 的 未 来 ， 有 理由 相信 Java 平 台 会 一 直 发 展 下 去 。 其 中 
很 重要 的 依据 是 Java 平 台 的 开放 性 。 依 托 JCP 和 OpenJDK 项 目 ，Java 平 
台 不 仅 在 语言 规范 这 个 层次 上 有 健康 的 开放 管理 流程 ， 也 有 与 之 对 应 
的 参考 实现 。Java 语 言 有 着 人 数 众 多 的 开发 者 社区 ， 每 年 有 非常 多 新 的 
开发 者 学 习 和 使 用 Java。 大 量 的 开发 者 使 用 Java 语 言 开发 各 种 不 同类 型 
的 应 用 。 在 社区 中 可 以 看 到 很 多 提供 不 同 功能 的 类 库 和 框架 。Java 虚 拟 
机 已 经 被 安装 到 数 以 十 亿 计 的 不 同类 型 的 设备 商 ， 包 括 服务 器 、 个 人 
计算 机 、 移 动 设备 和 智能 卡 等 。 依 托 庞大 的 社区 和 数量 众多 的 运行 平 
台 ，Java 语 言 的 发 展 前 景 是 非常 乐观 的 。Java7、Java8 ， 以 及 即将 在 
2016 年 发 布 的 Java9， 有 力 地 回应 了 这 样 的 论调 ， 让 开发 者 取舍 看 到 了 
Oracle 执 掌 Java 后 Java 的 发 展 前 景 ， 给 了 开发 者 信心 。 


8.1.5 物 联 网 : Java 和 你 是 一 对 


从 1969 年 至 今 的 这 段 漫长 时 光 当 中 ， 网 络 设 备 已 经 完成 了 完整 的 
爆发 式 增长 。 从 当初 通过 ARPANET 实 现 对 接 的 四 台 高 校 计算 机 开始 ， 
如 今世 界 上 已 经 有 二 十 亿 人 频繁 访问 互联 网 。 在 不 久 的 将 来 ， 联 网 设 
备 数 字 还 将 迅速 翻番 甚至 再 次 翻番 ， 即 由 目前 的 数 十 亿 台 增长 至 说 入 
式 处 理 时 代 的 成 百 上 千 亿 人 台 。 我 们 生活 中 的 方方面面 都 将 与 联网 设备 
相 结 合 : 家 庭 环境 、 办 公 环 境 、 车 载 环境 、 设 备 、 工 具 以 及 玩具 等 。 
可 以 预见 ， 作 为 一 款 专 门 针 对 说 入 式 计 算 与 实时 化 流程 场景 所 构建 的 
编程 语言 ，Java 将 成 为 物 联网 时 代 下 的 最 佳 选择 。 

十 九 年 前 ，David L.Ripps 曾 为 JavaWorld 编 瑟 了 一 份 概述 性 资料 ， 
介绍 了 Java 在 主 入 式 系 统 中 的 作用 。Ripps 的 文章 从 今天 的 角度 来 看 同 
样 极 具 可 读 性 ， 特 别 是 对 于 那些 希望 了 解 髋 入 式 系 统 编程 接口 如 何 与 
联网 移动 设备 及 物 联网 机 制 协作 的 朋友 而 言 。 

尽管 物 联网 瀛 潮 的 席卷 之 势 中 确实 存在 一 部 分 炒作 成 分 ， 但 其 背 
后 的 现实 情况 在 于 ， 互 联网 增长 将 使 上 一 代 计 算 机 制 变 得 相对 比较 琐 
碎 。 物 联网 不 仅 客 观 存在 ， 而 且 还 将 给 一 切 带 来 颠覆 性 的 改变 。 人 参考 
以 下 时 间 进 程 ， 我 们 首先 对 过 往 互 联网 技术 在 不 同 阶段 中 的 发 展 轨迹 
作出 一 番 回 顾 : 

m 1982 年 到 1989 年 : TCP/IP 网 络 诞生 。 


m 1985 年 到 1989 年 : 互联 网 技术 的 商业 化 趋势 开始 出 现 。 


m 1990 年 到 1991 年 : 万 维 网 正式 建立 。 

m 1990 年 到 1998 年 : 传统 台式 计算 机 被 重新 设计 为 实质 层面 上 的 联 
网 设备 。 

加 1996 年 至 今 虽 然 进展 缓慢 但 却 可 以 肯定 的 是 ， 我 们 正 逐 步 进入 到 
移动 联网 设备 ( 即 物 联网 ) 主导 一 切 的 新 时 代 当 中 。 

目前 作为 物 联 网 前 提 性 条 件 各 类 补充 性 技术 正在 陆续 上 线 。 
HTTP/2 是 一 套 关 键 性 网 络 协议 ， 它 的 出 现在 一 定 程度 上 实现 了 机 器 到 
机 器 之 间 的 通信 和 需求 。Thingsee 则 是 开发 者 工具 领域 的 典型 代表 ， 也 标 
志 着 物 联网 发 展 所 需要 的 硬件 基础 正 逐 渐 成 形 。 

硅谷 智囊 Tim O'Reily 已 经 作出 强调 ， 表 示 物 联网 的 成 果 将 不 仅仅 
是 将 咖啡 机 或 者 电 冰 箱 等 无 关 紧 要 的 设备 接 入 网 络 那么 单纯 。 在 理想 
的 传感器 与 自动 化 机 制 支撑 之 下 ， 物 联网 将 真正 将 人 类 文明 提升 到 新 
高 度 。 而 Java 将 在 将 在 这 场 颠 覆 性 变革 中 扮演 主力 角色 。 

2014 年 9 月 ，Andrew C.Oliver 撰 写 了 一 篇 关于 物 联网 实现 水 平 与 团 
队 协 作 间 关系 的 文章 。 在 这 种 情况 下 ， 团 队 协 作 体系 将 由 人 与 计算 机 
共同 构成 。 

由 于 设备 的 通信 对 象 不 再 局 限于 人 、 同 时 需要 面 对 其 他 设备 ， 因 
此 将 从 根本 层面 带 来 一 系列 新 功能 。 有 具体 而 言 ， 我 们 的 电 冰 箱 不 仅 能 
够 感知 到 用 户 的 西红柿 储量 即将 告 歼 ， 同 时 也 能 根据 个 人 饮食 习惯 发 
出 食品 订单 。 普 适 计 算 的 成 功 也 恰恰 体现 在 这 里 ， 其 融入 背景 当中 ， 
并 与 其 他 设备 共同 完成 任务 、 事 件 以 及 对 接 。 只 有 执行 级 别 的 结果 才 
会 被 交付 至 使 用 者 面前 。 物 联网 的 崛起 将 带 来 大 量 我 们 前 所 未 见 、 甚 
至 难以 想象 的 创新 型 成 果 ， 并 以 无 缝 化 方式 将 其 奉 至 我 们 手中 。 

Java 在 诞生 早期 正 是 针对 攀 入 式 计算 而 打造 。 其 早期 版 本 专门 针对 
各 类 家 用 电器 ， 如 电视 机 栅 盒 接口 。James Goslin 在 打造 Java 初 始 版 本 
时 正 是 将 设备 间 通 信 作 为 其 关注 重点 ， 而 他 当时 就 想到 其 作用 不 仅 要 
实现 设备 与 人 之 间 的 通信 、 更 要 承担 起 设备 与 设备 间 的 通信 任务 。 二 
十 年 之 后 ， 这 些 初始 设计 优势 终于 迎 来 了 自己 的 黄金 时 代 ， 物 联网 的 
光辉 岁月 即将 拉 开 序幕 。 

出 色 的 普及 水 平 也 使 其 适合 物 联网 时 代 的 实际 需求 。 全 球 范围 内 
投入 到 Java 领 域 的 海量 资源 使 这 款 编程 语言 成 为 新 生 代 程序 员 们 的 最 
爱 ， 同 时 也 确保 了 其 能 够 在 全 部 以 其 为 基础 的 生产 系统 中 得 到 良好 的 


维护 与 支持 。 数 十 万 款 成 功 的 应 用 程序 及 系统 方案 已 经 充分 证 明了 Java 
的 强大 实力 。 

对 于 希望 在 能 入 式 编程 领域 一 展 身手 的 开发 人 员 而 言 ， 最 重要 的 
是 对 Java 平 台中 的 不 同 组 成 部 分 加 以 区 分 。 在 敬 入 式 编 程 工作 中 ， 我 们 
无 须 对 自己 的 编码 或 者 阅读 方式 做 出 任何 变更 : 出 色 的 Java 程 序 员 能 够 
像 查看 典型 桌面 企业 应 用 程序 那样 轻松 疝 读 诅 入 式 源 代 码 内 容 。 不 过 
库 ， 特 别 是 在 开发 〈 及 测试 ) 环境 中 ， 将 专门 面向 纵 入 式 Java 编 程 。 请 
确保 大 家 拥有 适用 于 目标 峙 入 式 环境 的 正确 工作 链 。 

甲骨 文公 司 已 经 针对 实时 系统 对 Java SE 进 行 了 改进 ， 并 表示 Java 
SE 较 过 去 已 经 能 够 带 来 更 理想 软 实时 要 求 支持 效果 。 此 外 ，Java 对 于 
典 入 式 编 程 作出 了 多 项 承诺 ， 而 且 其 在 满足 即将 全 面 爆发 之 物 联网 的 
需求 及 可 能 性 方面 还 有 很 长 的 发 展 道路 要 走 。 数 百 亿 由 Java 驱 动 的 设备 
将 在 未 来 几 年 内 成 为 物 联网 网 络 体系 中 的 组 成 部 分 。 


8.1.6 Java 模 块 化 发 展 


近 几 年 来 ，Java 模 式 化 一 直 是 一 个 比较 活跃 的 话题 。 所 谓 模块 化 指 
的 就 是 开发 人 员 在 构建 大 型 系统 时 ， 能 够 将 系统 中 的 每 一 个 功能 模块 
进行 独立 的 开发 和 物理 部 署 ， 这 样 做 的 优点 不 仅 能 够 有 效 降 低 各 个 业 
务 模块 之 间 的 耦合 ， 同 时 还 能 够 保证 当 单 一 模块 发 生 故 障 时 不 会 影响 
系统 整体 的 运行 。 当 然 模 块 化 本 身 只 是 一 种 概念 ， 其 目的 就 是 为 了 将 
系统 中 原本 耦合 的 逻辑 机 型 分 解 ， 以 此 满足 各 个 模块 之 间 的 独立 ， 并 
定义 一 种 标准 化 的 接口 契约 来 进行 相互 之 间 的 通信 。 尽 管 Java 目 前 并 没 
有 在 JDK 中 内 置 模块 化 编程 技术 (预计 J]JDK9 会 推出 ) ， 但 这 似乎 并 不 
能 阻挡 开发 人 员 选 用 OSGi 技 术 作为 模块 化 编程 的 首选 。 早 在 2007 年 的 
时 候 ， 由 Sun 公 司 主导 并 提交 的 JSR-277 (Java 模 块 化 系统 ) 规范 并 没有 
通过 JCP 组 织 的 审核 ， 这 主要 是 由 于 JCP 专 家 组 织 通过 投票 将 IBM 公 司 
提交 的 JSR-291 (OSGiR4.1) 纳入 了 Java 模 块 化 规范 标准 。 直 到 Sun 公 
司 在 Java7 早 期 时 ， 再 次 提交 JSR-294 (Java 模 块 化 系统 的 改进 支持 ) 规 
范 ， 可 惜 最 终 还 是 未 能 如 愿 。 不 得 已 Sun 公 司 只 能 够 避 开 JCP 组 织 ， 在 
OpenJDK 中 创建 了 一 个 叫 作 Jigsaw 的 子 项 目 来 实现 Java 模 块 化 编程 技 
术 ， 但 该 项 目 却 被 迫 延 期 到 Java9 中 进行 发 布 。 可 以 断定 OSGi 技 术 会 使 
Java 模 块 化 规范 标准 。 


模块 化 是 个 一 般 概念 ， 这 一 概念 也 适用 于 软件 开发 ， 可 以 让 软件 
按 模 块 单独 开发 ， 各 模块 通常 都 用 一 个 标准 化 的 接口 来 进行 通信 。 实 
际 上 ， 除 了 规模 大 小 有 区 别 外 ， 面 向 对 象 语言 中 对 象 之 间 的 天 注 点 分 
离 与 模块 化 的 概念 基本 一 致 。 通 常 ， 把 系统 划分 为 多 个 模块 有 助 于 将 
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(文档 中 说 明了 其 用 途 ) 。 此 外 ， 它 们 也 有 自己 依赖 的 类 库 (比如 
JMX 或 JMS) 。 这 将 引起 自动 依赖 管理 器 引入 许多 并 非 必需 的 类 库 : 以 
Log4J-1.2.15 为 例 ， 引 入 了 超过 10 个 依赖 类 库 (包括 javax.mail 和 
javax.jms) ， 尽 管 这 些 类 库 中 有 不 少 对 于 使 用 Log4J 的 程序 来 说 根本 不 
需要 。 

某 些 情况 下 ， 一 个 模块 的 依赖 可 以 是 可 选 的 ; 换 句 话说 ， 该 模块 
可 能 有 一 个 功能 子 集 缺少 依赖 。 在 上 面 的 例子 中 ， 如 果 JMS 没 有 出 现在 
运行 时 classpath 中 ， 那 么 通过 JMS 记 录 日 志 的 功能 将 不 可 用 ， 但 是 其 他 
功能 还 是 可 以 使 用 的 。Java 通 过 使 用 延迟 链接 一 deferred linking 来 达到 
这 一 目的 : 直到 要 访问 一 个 类 时 才 需 要 其 出 现 ， 缺 少 的 依赖 可 以 通过 
ClassNotFoundException 来 处 理 。 其 他 一 些 平 台 的 弱 链接 ， 例 如 weak 
linking 概 念 ， 也 是 做 类 似 的 运行 时 检查 。 

通常 ， 模 块 都 附带 一 个 版 本 号 。 许 多 开源 项 目 生成 的 发 行 版 都 是 
以 类 似 log4j-1.2.15.jar 的 方式 命名 的 。 这 样 开发 者 就 可 以 在 运行 时 通过 
手动 方式 来 检测 特定 开源 类 库 的 版 本 。 可 是 ， 程 序 编译 的 时 候 可 能 使 
用 了 另 一 个 不 同 版 本 的 类 库 : 假定 编译 时 用 log4j-1.2.3.jar 而 运行 时 用 
log4j-1.2.15.jar， 程 序 在 行为 上 依然 能 够 保持 兼容 。 即 使 升级 到 下 一 个 
小 版 本 ， 仍 然 是 兼容 的 (这 就 是 为 什么 log4j 1.3 的 问题 会 导致 一 个 新 分 
支 2.0 产 生 ， 以 表示 兼容 性 被 打破 ) 。 所 有 这 些 都 是 基于 惯例 而 非 运 行 
时 的 已 知 约束 。 

无 论 在 编译 时 还 是 运行 时 ，Java 的 classpath 都 是 扁平 的 。 换 句 话 
说 ， 应 用 程序 可 以 看 到 classpath 上 的 所 有 类 ， 而 不 管 其 顺序 如 何 (如 果 
没有 重复 ， 是 这 样 ; 否则 ， 总 是 找 最 前 面 的 ) 。 这 就 使 Java 动 态 链 接 成 
为 可 能 : 一 个 处 于 classpath 前 面 的 已 装载 类 ， 不 需要 解析 其 所 引用 的 可 
能 处 于 classpath 后 面 的 那些 类 ， 直 到 确实 需要 他 们 为 止 。 


如 果 所 使 用 的 接口 实现 到 运行 时 才能 清楚 ， 通 常 使 用 这 种 方法 。 
例如 ， 一 个 SQL 工具 可 以 依赖 普通 JDBC 包 来 编译 ， 而 运行 时 (可 以 有 
附加 配置 信息 ) 可 以 实例 化 适当 的 JDBC[25] 驱 动 。 这 通常 是 在 运行 时 
将 类 名 (实现 了 预定 义 的 工厂 接口 或 抽象 类 ) 提供 给 Class.forName 查 
找 来 实现 。 如 果 指 定 的 类 不 存在 (或 者 由 于 其 他 原因 不 能 加 载 ) ， 则 
会 产生 一 个 错误 。 

因此 ， 模 块 的 编译 时 classpath 可 能 会 与 运行 时 classpath 有 些微 妙 的 
差别 。 此 外 ， 每 个 模块 通常 都 是 独立 编译 的 (模块 A 可 能 是 用 模块 C 
1.1 来 编译 的 ， 而 模块 B 则 可 能 是 用 模块 C 1.2 来 编译 的 ) ， 而 另 一 方 
面 ， 在 运行 时 则 是 使 用 单一 的 路 径 (在 本 例 中 ， 即 可 能 是 模块 C 的 1.1 
版 本 ， 也 可 能 是 1.2 版 本 ) 。 这 就 会 导致 依赖 地 狱 (Dependency 
Hell) ， 特 别 当 它 是 这 些 依赖 传递 的 末尾 时 更 是 这 样 。 不 过 ， 像 Maven 
和 Ivy 这 样 的 构建 系统 可 以 让 模块 化 特性 对 开发 者 是 可 见 的 ， 甚 至 对 最 
终 用 户 也 是 可 见 的 。 

目前 ，Java 领 域 存在 许多 模块 化 系统 和 plugin 体 系 。IDE 是 名 气 最 
大 的 ，IntellijJ、NetBeans 和 Eclipse 都 提供 了 其 自己 的 plugin 系 统 作为 其 
定制 途径 。 而 且 ， 构 建 系 统 (Ant Maven) 甚至 终端 用 户 应 用 (Lotus 
Notes, Mac AppleScript 应 用 ) 都 有 能 够 扩展 应 用 或 系统 核心 功能 的 概 

OSGi 是 Java 领 域 里 无 可 辩驳 的 最 成 熟 的 模块 系统 ， 它 与 Java 几 乎 是 
如 影 相 随 ， 最 早出 现 于 JSR 8， 但 是 最 新 规范 是 JSR 291。OSGi 在 JAR 的 
MANIFEST.MF 文 件 中 定义 了 额外 的 元 数据 ， 用 来 指明 每 个 包 所 要 求 的 
依赖 。 这 就 让 模块 能 够 (在 运行 时 ， 检查 其 依赖 是 否 满足 要 求 ， 另 
外 ， 可 以 让 每 个 模块 有 自己 的 私有 classpath (因为 每 个 模块 都 有 一 个 
ClassLoader) 。 这 可 以 让 dependency hell 尽 早 被 发 现 ， 但 是 不 能 完全 避 
免 。 和 JDBC 一 样 ，OSGi 也 是 规范 〈 目 前 是 4.2 版 ) ， 有 多 个 开源 OS 
商业 ) 实现 。 因 为 模块 不 需要 依赖 任何 OSGi 的 特定 代码 ， 许 多 开源 类 
库 现 在 都 将 其 元 信息 富 入 到 manifest 中 ， 以 便 OSGi 运 行 时 使 用 。 有 些 程 
序 包 没有 这 么 做 ， 也 可 以 用 bnd 这 样 的 工具 ， 它 可 以 处 理 一 个 已 有 的 
JAR 文 件 并 为 其 产生 合适 的 默认 元 信息 。 自 2004 年 Eclipse 3.0 从 专 有 
plugin 系 统 切 换 到 OSGi 之 后 ， 许 多 其 他 专 有 内 核 系统 (JBoss, 
WebSphere, Weblogic) 也 都 随 之 将 其 运行 时 转向 基于 OSGi 内 核 。 


OpenJDK 中 的 Jigsaw 项 目的 目标 在 于 为 Java 平 台 增 加 模块 化 的 支 
持 ， 这 也 是 Java SE8 的 重要 组 成 部 分 。 
Jigsaw 项 目 为 Java 语 言 增加 了 模块 的 概念 。 模 块 式 Java 类 型 的 集 
合 。 每 个 模块 由 自己 的 名 称 、 一 个 可 选 的 版 本 号 ， 以 及 当前 模块 和 其 
他 模块 之 间 关 系 的 摘 述 。 模 块 之 间 最 重要 的 关系 是 依赖 关系 。 一 个 模 
块 可 以 依赖 其 他 的 模块 ， 并 利用 所 依赖 的 模块 提供 出 的 Java 类 。 对 于 一 
个 模块 来 说 ， 模 块 本 身 的 信息 由 名 为 module-info.java 的 Java 文 件 来 提 
供 。 下 面 给 出 了 module-info.jav 文 件 的 源 代 码 。 模 块 *<com.my.base” 的 版 
号 是 1.0， 依 赖 于 版 本 号 为 2.0 的 “com.example” 模 块 。 通 过 “exports” 声 
明了 模块 <com.mybase” 中 的 “com.mybasesutils” 包 对 依赖 它 的 模块 是 可 
Ul Bj. 3H XJ "class" Fi HH T f XR "com.my.base" BY È Java KR = 
“com.my.base.MainApp”。 如 代码 清单 8-1 所 示 。 


代码 清单 8-1 Map cacheMap 缓存 池 
module com.my.base 8 1.0{ 
requires com.example @ 2.0; 
exports com.my.base.utils; 
class com.my.base.MainApp; 

} 
module com.my.ui @ 1.0{ 
requires com.my.base; 


} 


在 模块 中 ， 除 了 module-info.java 文 件 之 外 ， 其 他 的 内 容 与 一 般 的 
Java 程 序 中 可 以 包含 的 内 容 相 同 ， 可 以 包括 Java 源 代码 、 资 源 文 件 、 配 
置 文 件 和 本 地 代码 等 。 在 编译 过 程 中 ， 模 块 中 包含 的 源 代码 会 被 变 
异 ， 然 后 进行 打包 和 发 布 。 打 包 好 的 模块 可 以 安装 到 某 个 模块 仓库 
中 。 这 个 仓库 中 包含 了 所 有 可 用 的 模块 。 在 运行 时 ， 虚 拟 机 会 负责 从 
模块 仓库 中 加 载 模块 ， 并 与 它 所 依赖 的 其 他 模块 进行 链接 ， 之 后 就 可 
以 运行 该 模块 了 。 


8.1.7 OpenJDK 的 发 展 


在 Java 语 言 产 生 之 后 的 很 长 一 段 时 间 内 ，Java 语 言 的 规范 制定 以 及 
类 库 和 运行 环境 的 开发 工作 ， 都 是 由 Sun 公 司 独立 完成 的 ， 都 是 Sun 公 
司 的 私有 实现 。 在 Java 发 展 的 初期 ， 这 种 方式 避免 了 烦琐 的 流程 ， 降 低 
了 对 外 的 沟通 成 本 ， 是 有 利于 Java 语 言 的 快速 发 展 的 。 但 是 随 着 Java 语 
言 的 日 益 流行 ， 这 种 Sun 公 司 的 私有 实现 模式 已 经 不 能 适应 发 展 的 要 求 
了 。 首 先是 广大 Java 开 发 者 对 Java 的 需求 越 来 越 多 ， 单 赁 Sun 公 司 一 家 
很 难 快速 应 对 。 另 外 对 那些 采用 了 Java 平 台 的 企业 来 说 ， 一 个 很 现实 的 
担忧 是 Java 平 台 的 供应 商 锁定 (Vendor lock-in) 问题 。 如 果 自 己 公司 的 
核心 业务 系统 都 基于 Java 平 台 来 构建 ， 而 这 个 平台 本 身 却 是 另外 一 家 公 
司 的 私有 技术 ， 有 这 样 的 顾虑 情 有 可 原 。Sun 公 司 也 意识 到 这 一 点 ， 于 
是 开始 了 Java 平 台 的 开放 化 进程 。 

首先 开放 的 是 Java 平 台 的 规范 。 Sun 公 司 公 开 了 Java 语 言 规范 和 
Java 虚 拟 机 规范 。Java 语 言 规范 详细 描述 了 Java 语 言 的 语法 和 重要 特 
性 。Java 虚 拟 机 规范 规定 了 Java 字 节 代 码 规范 和 执行 Java 字 节 代 码 的 虚 
拟 机 的 相关 细节 。Sun 公 司 依托 Java 程 序 社区 JCP 的 流程 来 规范 对 Java 平 
台所 做 的 各 种 修改 ， 同 时 依赖 社区 的 力量 来 完善 Java 平 台 本 身 。 社 区 对 
Java 平 台 更 新 的 贡献 的 一 个 典型 例子 是 J2SE5.0 中 引入 的 同步 实用 类 库 
java.util.concurrent 包 。 在 这 之 前 ， 使 用 Java 进 行 多 线程 编程 只 能 使 用 最 
基本 的 几 个 原 语 ， 不 但 复杂 而 且 容 易 出 错 。Doug Lea 领 导 开 发 了 方便 
多 线程 开发 的 实用 工具 包 。 这 个 工具 包 最 初 是 独立 分 发 的 ， 后 来 正式 
成 为 Java 平 台 的 一 部 分 。 

另 一 一 部 分 需要 开放 的 是 Sun 自 己 的 Java 虚 拟 机 实现 、Java 类 库 实 
现 和 编译 器 等 实用 工具 。Sun 公 司 于 2006 年 宣布 Java 将 成 为 开放 源 代码 
的 软件 。 为 了 实践 这 个 开放 策略 ，Sun 公 司 开 发 的 HotSpot 虚 拟 机 和 编 
译 器 最 先 成 为 使 用 GPL 协议 的 自由 软件 。 接 着 Java 类 库 中 的 绝 大 部 分 都 
按照 GPL 协议 开放 了 源 代 码 。 而 对 于 剩 下 的 小 部 分 由 于 版 权 原因 无 法 
开放 源 代 码 的 类 库 ， 也 在 社区 的 努力 下 找到 了 蔡 代 的 开源 实现 。 至 
此 ，Java 语 言 终 于 有 了 一 个 自由 的 开放 源 代 码 的 实现 ， 即 OpenJDK。 

OpenJDK 的 出 现 正 在 对 Java 语 言 产 生 着 积极 而 深远 的 影响 。 依 托 于 
社区 的 开放 源 代 码 模 式 ， 使 Java 平 台 可 以 依靠 社区 的 力量 快速 发 展 。 而 
这 种 模式 也 避免 了 供应 商 锁定 的 问题 。 值 得 一 提 的 是 ，OpenJDK 的 出 
现 并 不 妨碍 其 他 私有 的 JDK 的 发 展 。 其 他 公司 仍然 可 以 针对 不 同 的 应 用 


环境 开发 出 更 加 适合 的 JDK， 这 些 私 有 的 JDK 也 可 以 自由 地 使 用 
OpenJDK 作 为 其 实现 的 基础 。 

目前 的 OpenJDK 主 要 有 JDK7 和 JDK6 两 个 版 本 。OpenJDK7 是 目前 
主要 开发 的 版 本 ， 也 是 Java SE7 的 参考 实现 。OpenJDK6 则 是 Java SE6 
的 一 个 开放 源 代 码 的 实现 ， 主 要 被 用 在 Fedora 等 Linux 分 发 平台 上 。 

在 Oracle 公 司 收 购 了 Sun 公 司 之 后 ，Oracle 公 司 并 没有 改变 在 Java 平 
台 上 的 开放 策略 ， 而 是 继续 支持 OpenJDK 的 发 展 。 随 后 ，Oracle 同 IBM 
和 苹果 公司 都 建立 了 合作 关系 ， 共 同 推进 OpenJDK 的 发 展 。 


8.2 系统 架构 优化 建议 
8.2.1 系统 架构 调 优 


8.2.1.1 系统 架构 过 程 中 常用 到 的 术语 

性 能 : Web 系 统 的 性 能 受 多 方面 因素 的 影响 ， 但 大 多 数 开发 人 员 主 
要 关心 的 是 响应 时 间 和 可 扩展 性 这 两 方面 。 

m 响 应 时 间 : Web 应 用 从 收 到 请 求 到 返回 响应 结果 所 花费 的 时 间 。 
而 应 用 系统 应 该 在 可 接受 的 时 间 范 围 内 返回 响应 结果 ， 否 则 就 不 能 算 
是 一 个 性 能 良好 的 应 用 系统 。 

m 可 扩展 性 : 如 果 Web 应 用 通过 增加 更 多 硬件 可 以 使 处 理 的 请 求 数 
呈 线 性 增长 ， 那 么 该 应 用 是 可 扩展 的 。 

在 同一 个 应 用 中 ， 响 应 时 间 和 可 扩展 性 并 不 总 是 能 够 同时 达到 最 
好 的 效果 。 要 么 应 用 程序 有 可 接受 的 响应 时 间 但 是 不 能 处 理 超过 一 定 
数量 的 请 求 ;， 要 么 应 用 程序 可 以 处 理 大 量 请 求 ， 但 是 响应 时 间 却 不 尽 
如 人 意 ， 甚 至 非常 糟糕。 因此 ， 通 常情 况 下 我 们 需要 在 这 两 个 要 素 中 
寻求 平衡 点 使 我 们 的 应 用 系统 性 能 达到 最 佳 状态 。 

扩展 的 方式 可 以 分 为 纵向 扩展 和 横向 扩展 两 种 。 

m 纵向 扩展 (垂直 扩展 ) : 为 单 台 机 器 增加 CPU 或 者 提高 单 台 机 器 
CPU 性 能 。 

@ 横向 扩展 (水 平 扩展 ) : 增加 服务 器 数量 


一 般 情况 下 水 平 扩展 比 垂直 扩展 更 重要 ， 主 要 是 因为 普通 硬件 商 
品 远 比 需 要 特殊 配置 的 硬件 便宜 (比如 大 型 机 ) ; 但 是 增强 单个 应 用 
在 一 个 硬件 商品 上 处 理 的 请 求 数 同样 也 是 比较 重要 的 。 同 时 ， 一 个 应 
用 系统 在 不 降低 响应 时 间 的 前 提 下 ， 如 果 通 过 添加 更 多 的 资源 能 够 处 
理 更 多 的 请 求 ， 那 么 这 个 系统 表现 良好 。 

容量 规划 : 需要 我 们 根据 产品 期 望 的 负载 量 来 预 估 所 需要 的 硬件 
数量 。 除 了 整体 的 预 估 外 ， 这 通常 还 包括 使 用 更 少 硬件 时 系统 的 性 能 
表现 情况 以 及 单 台 机 器 下 性 能 的 测试 及 评估 。 

架构 扩展 : 如 果 Web 应 用 的 每 一 层 在 多 层 架 构 体 系 中 都 是 可 扩展 
的 ， 那 么 该 应 用 也 具有 可 扩展 性 (横向 扩展 ) 。 例 如 ， 如 下 图 所 示 ， 
我 们 就 可 以 通过 增加 额外 的 资源 来 实现 应 用 层 和 数据 库 层 的 线性 扩 
展 。 

负载 均衡 器 扩展 : 可 以 通过 将 DNS 指向 多 个 了 P 以 及 使 用 DNS 轮 循 
查找 耳 地 址 的 方式 来 实现 负载 均衡 器 的 横向 扩展 。 或 者 可 以 使 用 多 级 
负载 均衡 ， 使 上 一 级 负载 均衡 器 来 分 发 至 下 一 级 负载 均衡 器 ， 但 使 用 
多 个 负载 均衡 器 的 情况 比较 少 ， 主 要 是 由 于 Web 容 器 一 般 可 以 处 理 几 千 
并 发 请 求 ， 而 使 用 Nginx 或 者 HAProxy 的 单个 负载 均衡 器 可 以 处 理 超过 
20000 的 并 发 请 求 ， 因 此 单个 负载 均衡 器 完全 可 以 代理 多 个 web 应 用 。 

数据 库 功 能 扩展 : 数据 库 功能 扩展 是 非常 常用 的 方式 ， 但 是 扩展 
数据 库 功能 (比如 创建 存储 过 程 或 自 定义 函数 ) 都 会 给 数据 层 带 来 额 
外 开销 以 及 增加 数据 层 的 复杂 性 。 

m 关系 型 数据 库 : 可 以 通过 主 从 同步 的 模式 实现 扩展 ， 主 库 以 写 入 
数据 为 主 ， 从 库 只 做 读 操作 。 但 是 ， 如 果 业 务 量 比较 大 时 主 从 同步 模 
式 所 提供 的 扩展 能 力 非 常 有 限 ， 此 外 ， 开 发 人 员 还 需要 通过 数据 库 拆 
分 技术 来 进一步 满足 业务 需求 。 

m NoSQL: CAP 定理 ( 译 者 注 : 不 熟悉 的 读者 可 通过 谷歌 查阅 ) 
告诉 我 们 一 个 应 用 不 可 能 同时 满足 一 致 性 、 可 用 性 、 分 区 容错 性 三 个 
要 求 。 而 NoSQL 一 般 则 是 通过 牺牲 一 定 的 一 致 性 来 获得 更 高 可 用 性 以 
及 更 好 的 分 区 容错 性 。 

数据 库 拆 分 可 以 垂直 拆 分 和 水 平 拆 分 : 

m 垂直 拆 分 (Partitioning) : 根据 领域 模型 概念 的 基础 可 以 将 数 
据 库 拆 分 为 几 个 松 耦 合 的 子 库 。 例 如 ， 拆 分 为 消费 者 数据 库 、 产 品 数 


据 库 。 另 一 种 垂直 拆 分 数据 库 的 方式 是 将 一 个 实体 的 一 部 分 字段 拆 分 
出 来 作为 一 个 新 数据 库 ， 另 一 部 分 字段 作为 另 一 个 数据 库 。 例 如 ， 将 
消费 者 数据 拆 分 为 消费 者 联系 信息 和 订单 数据 两 部 分 。 

m 水 平 拆 分 (Sharding) : 可 以 根据 数据 的 离散 属性 将 数据 进行 水 
平分 割 。 例 如 ， 消 费 者 可 以 根据 地 域 不 同 拆 分 为 美国 消费 者 数据 库 和 
欧洲 消费 者 数据 库 。 

将 数据 库 从 单个 数据 库 使 用 分 区 或 者 sharding 拆 分 为 多 个 数据 库 是 
一 项 非常 有 挑战 性 的 任务 。 

8.2.1.2 系统 扩展 的 方式 

可 扩展 系统 出 现 性 能 瓶颈 的 原因 主要 在 于 以 下 方面 。 

中 心 化 组 件 ， 应 用 中 一 个 不 可 扩展 的 组 件 直接 影响 整个 系统 或 者 
请 求 处 理 通道 所 能 处 理 请 求 数 的 上 限 。 

高 延迟 组 件 ， 一 个 高 延迟 的 组 件 会 影响 整个 系统 响应 时 间 的 下 
限 ， 使 整个 系统 响应 时 间 更 长 。 通 常 解决 这 个 问题 的 办 法 是 使 高 延迟 
的 组 件 作 为 后 台 任务 线程 或 者 使 用 异步 队列 来 解决 。 

CPU 消耗 型 应 用 : 如 果 一 个 应 用 的 吞吐 量 受 CPU 的 限制 ， 那 么 该 
应 用 就 是 CPU 消耗 型 应 用 。 此 类 引用 通过 增加 CPU 计算 速度 即 可 减少 
响应 时 间 。 

以 下 这 些 应 用 场景 可 能 属于 CPU 消耗 性 。 

(1) 需要 计算 或 者 处 理 数据 而 不 需要 做 IO 操作 的 应 用 (财务 或 者 
交易 类 系统 ) 。 

(2) 非常 依赖 缓存 而 且 不 做 任何 IO 操作 的 应 用 。 

(3) 异步 〈 非 阻塞 ) 模型 而 且 不 需要 等 待 外 部 资源 的 应 用 (被 动 
应 用 或 者 使 用 NoJs 的 应 用 ) o 

在 以 上 使 用 场景 中 已 经 正常 运行 的 应 用 ， 如 果 在 一 些 应 用 场景 
写 了 糟糕 的 或 者 效率 低下 的 代码 来 对 每 次 请 求 做 大 量 额 外 的 计算 或 者 
循环 ， 那 么 这 些 应 用 的 CPU 占用 率 将 非常 高 。 但 是 通过 分 析 应 用 可 以 
很 容易 发 现 并 修改 效率 低 的 问题 。 

IO 消耗 型 应 用 : 如 果 一 个 应 用 的 吞吐 量 受 IO 或 者 网 络 操作 影响 而 
且 提升 CPU 计算 速度 并 不 能 减少 响应 时 间 ， 那 么 该 应 用 即 为 IO 消耗 型 
应 用 。 大 多 数 应 用 是 IO 消 耗 型 应 用 主要 是 由 于 要 做 增 、 删 、 改 、 查 操 


作 。 而 性 能 调 优 和 对 iO 消 耗 型 应 用 进行 扩展 也 由 于 这 些 系统 依赖 于 其 
他 系统 的 下 行 流 量变 得 非常 困难 。 

以 下 这 些 应 用 场景 可 能 是 IO 消耗 性 。 

(1) 依赖 数据 库 并 进行 增 、 删 、 改 、 查 操作 的 应 用 。 
(2) 需要 下 行 流量 来 完成 本 身 操作 的 应 用 。 

我 们 经 常 在 书本 上 看 到 ， 系 统 架 构 好 坏 是 评判 架构 师 的 一 条 准 
则 ， 我 并 不 认为 存在 好 与 坏 之 说 ， 只 能 说 存在 是 否 适合 的 说 法 。 我 总 
结 了 一 些 常用 的 判断 标准 ， 分 享 给 大 家 。 

a 无 论 你 怎么 设计 系统 ， 系 统 整 体 化 来 说 一 定 要 能 容易 地 进行 水 平 
扩展 。 具 体 一 点 来 说 ， 你 的 整个 数据 流 过 程 中 的 所 有 环节 都 要 能 够 做 
到 水 平 扩展 。 这 样 ， 当 你 的 系统 存在 性 能 问题 时 , “加 30 台 的 服务 器 ” 
这 样 的 提议 才 不 会 被 人 讨 笑 。 

u 所 有 的 技术 都 不 是 一 朝 一 夕 能 搞定 的 ， 没 有 长 期 的 积累 ， 基 本 无 
望 。 我 们 可 以 看 到 ， 无 论 你 用 哪 种 都 会 引发 一 些 复 杂 性 ， 设 计 总 是 在 
做 一 种 权衡 。 

m 本 书 第 1 章 提 到 的 12306 票 务 系统 ， 集 中 式 的 售票 系统 设计 很 难 搞 
定 ， 我 们 通过 各 种 技术 提升 可 以 让 订 票 系统 有 几 百 倍 的 性 能 提升 。 但 
是 ， 总 的 来 说 ， 业 务 逻 辑 上 的 处 理 是 能 让 现 有 系统 性 能 有 质 的 提升 的 
最 好 方法 ， 例 如 让 集中 式 售 票 系统 变 成 各 点 分 散 售 票 (这 个 不 利于 业 
务 提 升 ， 基 本 不 适用 于 12306 和 我 国 国 情 ) 。 


8.2.2 Java 项 目 优化 方式 分 享 


一 般 来 说 ， 针 对 一 个 项 目的 优化 ， 我 们 需要 从 多 个 角度 分 析 导 致 
性 能 低 的 原因 ， 并 逐个 进行 优化 ， 最 终 使 得 程序 的 性 能 得 到 极 大 提 
升 ， 增 强 了 代码 的 可 读 性 、 可 扩展 性 。 

衡量 一 个 程序 是 否 优质 ， 可 以 从 多 个 角度 进行 分 析 。 其 中 ， 最 常 
见 的 衡量 标准 是 程序 的 时 间 复 杂 度 、 空 间 复 杂 度 ， 以 及 代码 的 可 读 
性 、 可 扩展 性 。 针 对 程序 的 时 间 复 杂 度 和 空间 复杂 度 ， 想 要 优化 程序 
代码 ， 需 要 对 数据 结构 与 算法 有 深入 的 理解 ， 并 且 熟 悉 计 算 机 系统 的 
基本 概念 和 原理 ， 而 针对 代码 的 可 读 性 和 可 扩展 性 ， 想 要 优化 程序 代 
码 ， 需 要 深入 理解 软件 架构 设计 ， 熟 知 并 会 应 用 合适 的 设计 模式 。 


首先 ， 如 今 计算 机 系统 的 存储 空间 已 经 足够 大 了 ， 达 到 了 TB 级 
别 ， 因 此 相 比 于 空间 复杂 度 ， 时 间 复 杂 度 是 程序 员 首 要 考虑 的 因素 。 
为 了 追求 高 性 能 ， 在 某 些 频繁 操作 执行 时 ， 甚 至 可 以 考虑 用 空间 换取 
时 间 。 

其 次 ， 由 于 受到 处 理 器 制造 工艺 的 物理 限制 、 成 本 限制 ，CPU 主 
频 的 增长 遇 到 了 瓶颈 ， 摩 尔 定律 已 渐渐 失效 ， 每 隔 18 个 月 CPU 主 频 即 
翻 倍 的 时 代 已 经 过 去 了 ， 程 序 员 的 编程 方式 发 生 了 彻底 的 改变 。 在 目 
前 这 个 多 核 多 处 理 器 的 时 代 ， 涌 现 了 原生 支持 多 线程 的 语言 (Wava) 
以 及 分 布 式 并 行 计算 框架 (如 Hadoop) 。 为 了 使 程序 充分 地 利用 多 核 
CPU， 简 单 地 实现 一 个 单线 程 的 程序 是 远 远 不 够 的 ， 程 序 员 需要 能 够 
编写 出 并 发 或 者 并 行 的 多 线程 程序 。 

最 后 ， 大 型 软件 系统 的 代码 行 数 达到 了 百 万 级 ， 如 果 没 有 一 个 设 
计 和 良好 的 软件 架构 ， 想 在 已 有 代码 的 基础 上 进行 开发 ， 开 发 代价 和 维 
护 成 本 是 无 法 想象 的 。 一 个 设计 良好 的 软件 应 该 具有 可 读 性 和 可 扩展 
性 ， 遵 循 “ 开 闭 原则 *、“ 依 赖 倒置 原则 *、“ 面 向 接口 编程 ”等 。 

8.2.2.1 一 般 性 软件 项 目 优 化 案例 

假设 我 们 有 这 么 一 个 项 目 ， 外 部 系统 DD 通过 系统 对 外 提供 的 REST 
API 接 口 从 系统 内 部 获取 信息 ， 从 中 提取 出 有 效 的 信息 ， 并 通过 JDBC 
存储 到 某 数据 库 系统 $ 中 ， 以 便 供 系统 其 他 部 分 使 用 ， 上 述 操作 的 执行 
频率 为 每 天 一 次 ， 一 般 在 午夜 当 系统 空闲 时 定时 执行 。 为 了 实现 高 可 
用 性 (High Availability) ， 外 部 系统 D 部 署 在 两 台 服 务 器 上 ， 因 此 需要 
分 别 从 这 两 台 服 务 器 上 获取 信息 并 将 信息 插入 数据 库 中 ， 有 效 信息 的 
条 数 达 到 了 上 千 条 ， 数 据 库 插入 操作 次 数 则 为 有 效 信息 条 数 的 两 倍 。 
系统 架构 图 如 图 8-1 所 示 。 


En 
外 部 系统 
REST API D 
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图 8-1 系统 架构 图 

为 了 快速 地 实现 预期 效果 ， 在 最 初 的 实现 中 优先 考虑 了 功能 的 实 
现 ， 而 未 考虑 系统 性 能 和 代码 可 读 性 等 。 系 统 大 致 有 以 下 的 实现 。 

(1) REST API 获 取信 息 、 数 据 库 操作 可 能 抛 出 的 异常 信息 都 被 记 
录 到 日 志文 件 中 ， 作 为 调试 用 。 

(2) 共有 5 次 数据 库 连 接 操 作 ， 包 括 第 一 次 清空 数据 库 表 ， 针 对 
两 个 外 部 系统 D 各 有 两 次 数据 库 插 入 操作 ， 这 5 个 连接 都 是 独立 的 ， 用 
完 之 后 即 释放 。 

(3) 所 有 的 数据 库 插入 语句 都 是 使 用 java.sql.Statement 类 生成 的 。 
(4) 所 有 的 数据 库 插入 语句 ， 都 是 单条 执行 的 ， 即 生成 一 条 执行 
一 条 。 
(5) 整个 过 程 都 是 在 单个 线程 中 执行 的 ， 包 括 数据 库 表 清空 操 
作 ， 数 据 库 插入 操作 ， 释 放 数 据 库 连 接 。 

(6) 数据 库 插 入 操作 的 JDBC 代 码 散 布 在 代码 中 。 虽 然 这 个 版 本 
的 系统 可 以 正常 运行 ， 达 到 了 预期 的 效果 ， 但 是 效率 很 低 ， 从 通过 
REST API 获 取信 息 ， 到 解析 并 提取 有 效 信息 ， 再 到 数据 库 插 入 操作 ， 
总 共 耗 时 100 秒 左右 。 而 预期 的 时 间 应 该 在 一 分 钟 以 内 ， 这 显然 是 不 符 
合 要 求 的 。 


开始 分 析 整 个 过 程 有 哪些 耗 时 操作 ， 以 及 如 何 提升 效率 ， 纺 短程 
序 执行 的 时 间 。 通 过 REST API 获 取信 息 ， 因 为 是 使 用 外 部 系统 提供 的 
API， 所 以 无 法 在 此 处 提升 效率 ; 取得 信息 之 后 解析 出 有 效 部 分 ， 因 为 
是 对 特定 格式 的 信息 进行 解析 ， 所 以 也 无 效率 提升 的 空间 。 综 上 所 
述 ， 效 率 可 以 大 幅度 提升 的 空间 在 数据 库 操作 部 分 以 及 程序 控制 部 
Ta 

针对 日 志 的 优化 

因为 从 两 台 服 务 器 的 外 部 系统 D 上 获取 到 的 信息 是 相同 的 ， 所 以 数 
据 库 插 入 操作 会 抛 出 异常 ， 异 常 信息 类 似 于 “Attempt to insert duplicate 
record”， 这 样 的 异常 信息 跟 有 效 信息 的 条 数 相等 ， 有 上 和 干 条 。 这 种 情 
况 是 能 预料 到 的 ， 所 以 可 以 考虑 关闭 日 志 记 录 ， 或 者 不 关闭 日 志 记 录 
而 是 更 改 日 志 输 出 级 别 ， 只 记录 严重 级 别 (severe level) 的 错误 信息 ， 
并 将 此 类 操作 的 日 志 级 别 调整 为 警告 级 别 (warming level) ， 这 样 就 不 
会 记录 以 上 异常 信息 了 。 本 项 目 使 用 的 是 Java 自 带 的 日 志 记 录 类 ， 以 
下 配置 文件 将 日 志 输 出 级 别 设置 为 严重 级 别 。 

通过 上 述 的 优化 之 后 ， 性 能 有 了 大 幅度 的 提升 ， 从 原来 的 100 秒 左 
右 降 到 了 50 秒 左右 。 为 什么 仅仅 不 记录 日 志 就 能 有 如 此 大 幅度 的 性 能 
提升 呢 ? 查阅 资料 ， 发 现 已 经 有 人 做 了 相关 的 研究 与 实验 。 经 常 听 到 
Java 程 序 比 C/C++ 程序 慢 的 言论 ， 但 是 运行 速度 慢 的 真正 原因 是 什么 ， 
估计 很 多 人 并 不 清楚 。 对 于 CPU 密集 型 的 程序 ( 即 程序 中 包含 大 量 计 
算 ) ，Java 程 序 可 以 达到 C/C++ 程 序 同等 级 别 的 速度 ， 但 是 对 于 IO 密集 
型 的 程序 ( 即 程序 中 包含 大 量 1/O 操 作 ) ，Java 程 序 的 速度 就 远 远 慢 于 
C/C++ 程序 了 ， 很 大 程度 上 是 因为 C/C++ 程序 能 直接 访问 底层 的 存储 设 
备 。 因 此 ， 不 记录 日 志 而 得 到 大 幅度 性 能 提升 的 原因 是 ，Java 程 序 的 
IO 操作 较 慢 ， 是 一 个 很 耗 时 的 操作 。 

针对 数据 库 连 接 的 优化 

假设 程序 中 共有 若干 次 数据 库 连 接 操 作 ， 每 次 都 需 重新 建立 数据 
库 连 接 ， 数 据 库 插 入 操作 完成 之 后 又 立即 释放 了 ， 数 据 库 连 接 没有 被 
复 用 。 为 了 做 到 共享 数据 库 连 接 ， 可 以 通过 单 例 模 式 (Singleton 
Pattern) 获得 一 个 相同 的 数据 库 连 接 ， 每 次 数据 库 连 接 操作 都 共享 这 个 
数据 库 连 接 。 这 里 没有 使 用 数据 库 连 接 池 (Database Connection Pool) 


是 因为 在 程序 只 有 少量 的 数据 库 连 接 操 作 ， 只 有 在 大 量 并 发 数据 库 连 
接 的 时 候 才 需要 连接 池 。 

通过 上 述 的 优化 之 后 ， 性 能 有 了 小 幅度 的 提升 ， 从 50 秒 左右 降 到 
了 40 秒 左右 。 共 享 数 据 库 连接 而 得 到 的 性 能 提升 的 原因 是 ， 数 据 库 连 
接 是 一 个 耗 时 耗资 源 的 操作 ， 需 要 同 远程 计算 机 进行 网 络 通 信 ， 建 立 
TCP 连 接 ， 还 需要 维护 连接 状态 表 ， 建 立 数据 缓冲 区 。 如 果 共 享 数据 库 
连接 ， 则 只 需要 进行 一 次 数据 库 连 接 操作 ， 省 去 了 多 次 重新 建立 数据 
库 连 接 的 时 间 。 

针对 数据 库 插入 数据 的 优化 

这 个 假想 项 目 内 部 存在 大 量 的 数据 库 插入 操作 ， 所 以 使 用 预 编译 
SQL 方 式 。 具 体 做 法 是 使 用 java.sql.PreparedStatement È $ 
java.sql.Statement 生 成 SQL 语 句 。PreparedStatement 使 得 数据 库 预先 编译 
好 SQL 语句 ， 并 用 来 传 入 参数 。 而 Statement 生 成 的 SQL 语句 在 每 次 提交 
时 ， 数 据 库 都 需 进 行 编译 。 在 执行 大 量 类 似 的 SQL 语句 时 ， 可 以 使 用 
PreparedStatement 提 高 执行 效率 。 使 用 PreparedStatement 的 另 一 个 好 处 
是 不 需要 拼接 SQL 语句 ， 代 码 的 可 读 性 更 强 。 通 过 上 述 的 优化 之 后 ， 
性 能 有 了 小 幅度 的 提升 ， 从 40 秒 左右 降 到 了 30 人 35 秒 左右 。 

此 外 ， 我 们 可 以 使 用 SQL 批 处 理 方 式 加 快 SQL 执 行 。 通 过 
java.sql.PreparedStatement 的 addBatch 方 法 将 SQL 语句 加 入 到 批 处理 ， 这 
样 在 调用 execute 方 法 时 ， 就 会 一 次 性 地 执行 SQL 批 处 理 ， 而 不 是 逐条 
执行 。 通 过 上 述 的 优化 之 后 ， 性 能 有 了 小 幅度 的 提升 ， 从 30~~35 秒 左 
右 降 到 了 30 秒 左右 。 

针对 多 线程 的 优化 

清空 数据 库 表 的 操作 ， 把 从 两 个 外 部 系统 D 取 得 的 数据 插入 数据 库 
记录 的 操作 ， 是 相互 独立 的 任务 ， 可 以 给 每 个 任务 分 配 一 个 线程 执 
行 。 清 空 数 据 库 表 的 操作 应 该 先 于 数据 库 插 入 操作 完成 ， 可 以 通过 
java.lang.Thread 类 的 join 方法 控制 线程 执行 的 先后 次 序 。 在 单 核 CPU 时 
代 ， 操 作 系 统 中 某 一 时 刻 只 有 一 个 线程 在 运行 ， 通 过 进程 /线程 调度 ， 
给 每 个 线程 分 配 一 小 段 执行 的 时 间 片 ， 可 以 实现 多 个 进程 /线程 的 并 发 

(concurrent) 执行 。 而 在 目前 的 多 核 多 处 理 器 背景 下 ， 操 作 系 统 中 同 
一 时 刻 可 以 有 多 个 线程 并 行 (parallel) 执行 ， 大 大 地 提高 了 计算 速 
度 。 


此 外 ， 通 过 采用 不 同 的 锁 机 制 ， 也 能 加 快 程序 的 执行 ， 具 体 请 见 
第 5 章 。 

通过 上 述 的 优化 之 后 ， 性 能 有 了 大 幅度 的 提升 ， 从 30 秒 左右 降 到 
了 15 秒 以 下 ，10~15 秒 之 间 。 使 用 多 线程 而 得 到 的 性 能 提升 的 原因 
是 ， 系 统 部 署 所 在 的 服务 器 是 多 核 多 处 理 器 的 ， 使 用 多 线程 ， 给 每 个 
任务 分 配 一 个 线程 执行 ， 可 以 充分 地 利用 CPU 计 算 资 源 。 

针对 设计 模式 的 优化 

原来 的 代码 中 混杂 着 JDBC 操 作 数 据 库 的 代码 ， 代 码 结构 显得 十 分 
凌乱 。 通 过 使 用 DAO 模 式 (Data Access Object Pattern) 可 以 抽象 出 数 
据 访 问 层 ， 这 样 使 得 程序 可 以 独立 于 不 同 的 数据 库 ， 即 便 访问 数据 库 
的 代码 发 生 了 改变 ， 上 层 调用 数据 访问 的 代码 无 须 改变 。 并 且 程 序 员 
可 以 摆脱 单调 烦琐 的 数据 库 代 码 的 编写 ， 专 注 于 业务 逻辑 层面 的 代码 
的 开发 。 通 过 上 述 的 优化 之 后 ， 性 能 并 未 有 提升 ， 但 是 代码 的 可 读 
性 、 可 扩展 性 大 大 地 提高 了 。 

总 的 来 说 ， 通 过 关闭 日 志 记 录 、 共 享 数据 库 连 接 、 使 用 预 编译 
SQL、 使 用 SQL 批 处 理 、 使 用 多 线程 实现 并 发 /并 行 、 使 用 DAO 模 式 抽 
象 出 数据 访问 层 ， 程 序 运 行 时 间 较 大 幅度 地 被 缩短 了 ， 在 性 能 上 得 到 
了 很 大 的 提升 ， 同 时 也 具有 了 更 好 的 可 读 性 和 可 扩展 性 。 

8.2.2.2 订单 系统 的 优化 方案 

要 优化 订单 系统 ， 提 高 订单 的 每 秒 交 易 数 量 (TPS, Transaction 
per second) ， 我 们 首先 要 做 的 是 对 下 订单 的 逻辑 进行 剥离 ， 只 保留 核 
心 部 分 ， 而 把 附加 功能 剔除 出 去 。 比 如 说 下 单 要 考虑 库存 量 、 考 虑 发 
短信 、 要 给 卖家 发 消息 通知 、 要 对 订单 做 统计 、 要 做 销售 额 统计 等 ， 
我 们 需要 对 这 些 功能 进行 分 析 ， 哪 些 功能 是 必需 的 ， 哪 些 是 附加 的 功 
能 ， 要 最 大 程度 提高 下 单 这 一 步 的 TPS， 就 要 先 不 考虑 这 些 附 加 的 功 
能 。 

下 单 必然 会 涉及 到 买 家 查看 订单 ， 和 卖家 查看 收 到 的 订单 ， 修 改 
订单 价格 等 ， 这 是 下 订单 的 核心 。 在 下 单 这 个 操作 中 有 买 家 和 卖家 两 
个 密切 关联 而 有 不 同 的 视角 ， 可 以 称 为 两 个 不 同 的 维度 。 一 般 来 说 ， 
订单 系统 的 下 单 过 程 这 一 步 涉及 到 少数 几 张 核心 数据 表 ， 而 这 几 张 数 
据 表 涵盖 了 这 两 个 维度 的 操作 。 


下 单 是 在 一 个 数据 库 事 务 中 进行 的 ， 要 提高 数据 库 的 事务 并 发 
数 ， 最 有 效 的 办 法 是 拆 分 ， 拆 分 有 两 种 ， 一 是 对 库 进 行 拆 分 ， 另 一 种 
是 在 同一 个 库 中 对 表 进 行 拆 分 。 要 做 拆 分 首先 就 要 考虑 拆 分 依据 的 字 
段 ， 淘 宝 是 根据 订单 号 做 拆 分 的 ， 而 下 单 中 有 两 个 维度 ， 买 家 和 卖 
家 ， 对 订单 做 拆 分 之 后 ， 必 须 还 是 可 以 通过 买 家 ， 卖 家 方便 地 查询 着 
两 个 维度 的 数据 。 该 怎么 办 呢 ? 假设 我 们 需要 拆 分 的 数据 库 的 规模 ， 
订单 表 拆 分 到 16 个 mysql 库 中 ， 而 在 每 个 库 中 又 将 订单 表 横 向 拆 分 为 64 
份 ， 相 当 于 将 一 个 表 拆 分 为 1024 份 。 拆 分 之 后 事务 会 分 散 到 1024 套 表 
中 ， 这 必然 会 很 大 程度 上 增加 并 发 的 事务 处 理 能 力 。 上 面 留 了 一 个 疑 
问 ， 经 过 拆 分 之 后 如 何 保证 买 家 卖家 快速 的 查询 其 下 的 订单 呢 ? 最 好 
的 办 法 是 保证 买 家 ， 卖 家 下 的 订单 在 一 张 表 中 ， 如 何 保证 呢 ? 淘宝 的 
做 法 是 将 买 家 的 id 取 模 后 放 到 订单 号 中 。 假 定 一 个 订单 号 是 
142424594267664; 这 个 订单 号 对 应 的 订单 该 放 在 哪 台 服务 器 上 的 哪个 
表 中 ， 是 根据 订单 的 后 四 位 7667， 对 1024 取 模 之 后 决定 的 ; 同时 7667 
是 买 家 id 的 后 四 位 。 这 样 买 家 在 查询 其 订单 时 就 可 以 通过 其 id 获得 其 订 
单 所 在 库 以 及 表 ， 就 可 以 方便 有 效 的 查询 买 家 订单 了 。 这 里 会 带 来 另 
外 一 个 问题 ， 卖 家 查询 订单 时 怎么 办 ? 前 面 我 们 已 经 提 到 卖家 和 买 家 
被 分 成 两 个 不 同 的 维度 来 做 表 设 计 ， 卖 家 查询 时 不 是 直接 查 订单 表 ， 
而 是 通过 卖家 维度 的 表 来 做 查询 。 卖 家 维度 的 表 的 插入 ， 更 新 是 通过 
在 订单 插入 时 发 一 个 消息 来 通知 插入 的 。 同 样 对 于 发 短信 、 发 旺旺 
(淘宝 专 有 ) 也 是 通过 消息 来 处 理 的 ， 这 些 附加 功能 不 参与 到 下 单 的 
事务 中 去 。 

即使 这 样 做 了 库 、 表 的 拆 分 ， 依 然 会 有 问题 。 淘 宝 在 双 11 时 的 一 
天 的 交易 量 就 达到 了 5000 多 万 ， 这 样 几 个 月 过 去 后 ， 这 些 拆 分 后 的 表 
中 的 数据 量 也 会 达到 很 大 的 一 个 量 ， 处 理 速 度 就 会 下 降 。 淘 宝 的 做 法 
是 把 三 个 月 之 前 的 老 数据 迁移 到 其 他 库 中 ， 这 样 就 避免 了 数据 量 增 大 
导致 的 系统 响应 时 间 降 低 的 问题 。 但 是 会 带 来 另外 一 个 问题 ， 用 户 在 
查询 订单 时 需要 同时 查 两 个 库 ， 一 个 是 历史 数据 表 ， 另 一 个 是 近期 数 
据 表 ; 这 个 问题 无 可 避免 ， 就 是 通过 查询 两 次 解决 。 

也 许 有 的 朋友 会 想到 拆 分 之 后 对 全 数据 做 统计 会 有 问题 。 如 果 在 
拆 分 后 的 表 上 做 统计 ， 是 肯定 会 有 问题 的 。 怎 么 做 呢 ? 很 简单 ， 把 数 
据 迁 移 到 别 的 库 中 去 做 统计 。 
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表 做 拆 分 可 以 大 大 地 提高 TPS， 但 是 也 会 遍 来 一 些 问题 ， 需 要 通 
可 靠 的 消息 通知 机 制 通知 其 他 模块 做 非 核心 处 理 的 事情 ， 需 要 通过 高 
效 的 搜索 系统 保证 搜索 数据 的 及 时 更 新 。 


8.2.3 面向 服务 架构 


面向 服务 架构 的 思想 在 整个 软件 的 架构 中 已 经 不 是 什么 新 鲜 的 东 
西 。 我 简单 地 认为 服务 化 是 模块 化 的 延伸 ， 所 以 服务 化 有 着 和 模块 化 
类 似 的 优点 和 缺点 。 无 论 你 采用 哪 种 协议 定义 服务 与 服务 之 间 的 通信 
方式 (如 WebServices、 私 有 协议 等 ) ， 这 并 不 是 服务 化 的 本 质 所 在 ， 
即使 Java 语 言 用 RMI 进 行 服 务 与 服务 之 间 的 通信 也 仍然 不 违背 服务 化 的 
ZR Elo 

为 什么 需要 面向 服务 架构 

m 我 觉得 面向 服务 的 根本 好 处 是 便于 管理 ， 也 是 应 用 大 到 一 定时 候 
的 必然 产物 。 这 往往 和 组 织 架 构 之 间 相 契合 。 其 实 不 合理 的 服务 划分 

会 带 来 服务 之 间 的 混乱 。 

m 面向 服务 是 一 个 解 耦 的 过 程 ， 松 耦合 降低 了 服务 之 间 的 依赖 ， 也 
意味 着 服务 一 个 服务 出 现 故 障 的 时 候 不 容易 引起 连锁 反应 ， 也 能 更 好 
的 控制 服务 与 服务 之 间 的 关系 与 优先 级 。 

不 同 语言 之 间 的 通信 。 

8.2.3.1 SOA 

面向 服务 架构 ， 它 可 以 根据 需求 通过 网 络 对 松散 厅 合 的 粗 粒 度 应 
用 组 件 进行 分 布 式 部 署 、 组 合 和 使 用 。 服 务 层 是 SOA 的 基础 ， 可 以 直 
接 被 应 用 调用 ， 从 而 有 效 控制 系统 中 与 软件 代理 交互 的 人 为 依赖 性 。 
SOA 是 一 种 粗 粒度 、 松 耦合 服务 架构 ， 服 务 之 间 通 过 简单 、 精 确定 义 
接口 进行 通讯 ， 不 涉及 底层 编程 接口 和 通讯 模型 。SOA 可 以 看 作 是 B/S 
模型 、XML (标准 通用 标记 语言 的 子 集 ) /Web Service 技 术 之 后 的 自然 
延伸 。SOA 将 能 够 帮助 软件 工程 师 们 站 在 一 个 新 的 高 度 理解 企业 级 架 
构 中 的 各 种 组 件 的 开发 、 部 署 形式 ， 它 将 帮助 企业 系统 架构 者 以 更 迅 
速 、 更 可 靠 、 更 具 重 用 性 架构 整个 业务 系统 。 较 之 以 往 ， 以 SOA 架 构 
的 系统 能 够 更 加 从 容 地 面 对 业 务 的 急剧 变化 。 
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传统 的 Web (HTML/HTTP) 技术 有 效 地 解决 了 人 与 信息 系统 的 交 
互 和 沟通 问题 ， 极 大 的 促进 了 B2C 模 式 的 发 展 。WEB 服务 
(XML/SOAP/WSDL) 技术 则 是 要 有 效 的 解决 信息 系统 之 间 的 交互 和 
沟通 问题 ， 促 进 B2B/EALCB2C 的 发 展 。SOA (面向 服务 的 体系 ) 则 是 
采用 面向 服务 的 商业 建 模 技 术 和 WEB 服 务 技术 ， 实 现 系 统 之 间 的 松 耦 
合 ， 实 现 系 统 之 间 的 整合 与 协同 。WEB 服 务 和 SOA 的 本 质 思路 在 于 使 
得 信息 系统 个 体 在 能 够 沟通 的 基础 上 形成 协同 工作 。 

对 于 面向 同步 和 异步 应 用 的 ， 基 于 请 求 /响应 模式 的 分 布 式 计算 来 
说 ，SOA 是 一 场 革命 。 一 个 应 用 程序 的 业务 逻辑 (business logic) RR 
些 单独 的 功能 被 模块 化 并 作为 服务 呈现 给 消费 者 或 客户 端 。 这 些 服务 
的 关键 是 他 们 的 松 耦 合 特性 。 例 如 ， 服 务 的 接口 和 实现 相 独 立 。 应 用 
开发 人 员 或 者 系统 集成 者 可 以 通过 组 合 一 个 或 多 个 服务 来 构建 应 用 ， 
而 无 须 理解 服务 的 底层 实现 。 举 例 来 说 ， 一 个 服务 可 以 用 。NET 或 
J2EE 来 实现 ， 而 使 用 该 服务 的 应 用 程序 可 以 在 不 同 的 平台 之 上 ， 使 用 
的 语言 也 可 以 不 同 。 

SOA 具 有 的 特性 

SOA 服 务 具 有 平台 独立 的 自我 描述 XML 文 档 。Web 服 务 描述 语言 
(WSDL，Web Services Description Language) 是 用 于 描述 服务 的 标准 
语言 。 

SOA 服务 用 消息 进行 通信 ， 该 消息 通常 使 用 XML Schema 来 定义 
(也 叫 作 XSD XML Schema Definition) 。 消 费 者 和 提供 者 或 消费 者 
和 服务 之 间 的 通信 和 多 见于 不 知道 提供 者 的 环境 中 。 服 务 间 的 通讯 也 可 
以 看 作 企业 内 部 处 理 的 关键 商业 文档 。 

在 一 个 企业 内 部 ，SOA 服 务 通过 一 个 扮演 目录 列表 (directory 
listing) 角色 的 登记 处 (Registry) 来 进行 维护 。 应 用 程序 在 登记 处 
(Registry) 寻找 并 调用 某 项 服务 。 统 一 描述 ， 定 义 和 集 成 (UDDI, 
Universal Description ， Definition ，and Integration) 是 服务 登记 的 标 


准 。 

每 项 SOA 服 务 都 有 一 个 与 之 相关 的 服务 品质 (QoS, quality of 
service) 。QoS 的 一 些 关键 元 素 有 安全 需求 (例如 认证 和 授权 ) ， 可 靠 
通信 (可 靠 消息 是 指 ， 确 保 消息 仅 发 送 一 次 ， 从 而 过 滤 重 复 信 
息 。) ， 以 及 谁 能 调用 服务 的 策略 。 


SOA 三 大 基本 特征 

1) 独立 的 功能 实体 

在 Internet 这 样 松 散 的 使 用 环境 中 ， 任 何 访 问 请 求 都 有 可 能 出 错 ， 
因此 任何 企图 通过 Internet 进 行 控制 的 结构 都 会 面临 严重 的 稳定 性 问 
题 。SOA 非 常 强调 架构 中 提供 服务 的 功能 实体 的 完全 独立 自主 的 能 
力 。 传 统 的 组 件 技术 ， 如 .NET Remoting，EJB，COM 或 者 CORBA， 都 
需要 有 一 个 宿主 (Host 或 者 Server) 来 存放 和 管理 这 些 功 能 实体 ; 当 这 
些 宿主 运行 结束 时 这 些 组 件 的 寿命 也 随 之 结束 。 这 样 当 宿主 本 身 或 者 
其 他 功能 部 分 出 现 问题 的 时 候 ， 在 该 宿主 上 运行 的 其 他 应 用 服务 就 会 
受到 影响 。 

SOA 架 构 中 非常 强调 实体 自我 管理 和 恢复 能 力 。 常 见 的 用 来 进行 
自我 恢复 的 技术 ， 比 如 事务 处 理 (Transaction) ， 消 息 队 列 (Message 
Queue) ， 宛 余部 署 (Redundant Deployment) 和 集群 系统 (Cluster) 
在 SOA 中 都 起 到 至 关 重 要 的 作用 。 

2) 大 数据 量 低 频率 访问 

对 于 .NET Remoting，EJB 或 者 XML-RPC 这 些 传统 的 分 布 式 计算 模 
型 而 言 ， 他 们 的 服务 提供 都 是 通过 函数 调用 的 方式 进行 的 ， 一 个 功能 
的 完成 往往 需要 通过 客户 端 和 服务 器 来 回 很 多 次 函数 调用 才能 完成 。 
在 Intranet 的 环境 下 ， 这 些 调用 给 系统 的 响应 速度 和 稳定 性 带 来 的 影响 
都 可 以 忽略 不 计 ， 但 是 在 Internet 环 境 下 这 些 因素 往往 是 决定 整个 系统 
是 否 能 正常 工作 的 一 个 关键 决定 因素 。 因 此 SOA 系 统 推 荐 采用 大 数据 
量 的 方式 一 次 性 进行 信息 交换 。 

3) 基于 文本 的 消息 传递 

由 于 Internet 中 大 量 异 构 系 统 的 存在 决定 了 SOA 系 统 必须 采用 基于 
文本 而 非 二 进 制 的 消息 传递 方式 。 在 COM、CORBA 这 些 传统 的 组 件 模 
型 中 ， 从 服务 器 端 传 往 客 户 端的 是 一 个 二 进 制 编码 的 对 象 ， 在 客户 端 
通过 调用 这 个 对 象 的 方法 来 完成 某 些 功能 ; 但 是 在 Internet 环 境 下 ， 不 
同 语言 ， 不 同 平台 对 数据 、 甚 至 是 一 些 基本 数据 类 型 定义 不 同 ， 给 不 
同 的 服务 之 间 传 递 对 象 带 来 的 很 大 困难 。 由 于 基于 文本 的 消息 本 身 是 
不 包含 任何 处 理 逻 辑 和 数据 类 型 的 ， 因 此 服务 间 只 传递 文本 ， 对 数据 
的 处 理 依赖 于 接收 端的 方式 可 以 帮忙 绕 过 兼容 性 这 个 的 大 泥 坑 。 


此 外 ， 对 于 一 个 服务 来 说 ，Internet 与 局 域 网 最 大 的 一 个 区 别 就 是 
在 mternet 上 的 版 本 管理 极其 困难 ， 传 统 软件 采用 的 升级 方式 在 这 种 松 
散 的 分 布 式 环境 中 几乎 无 法 进行 。 采 用 基于 文本 的 消息 传递 方式 ， 数 
据 处 理 端 可 以 只 选择 性 的 处 理 自己 理解 的 那 部 分 数据 ， 而 忽略 其 他 的 
数据 ， 从 而 得 到 的 非常 理想 的 兼容 性 。 

8.2.3.2 微服 务 架 构 (Microservices) 

对 微服 务 架 构 我 们 没有 一 个 明确 的 定义 ， 但 简单 来 说 微服 务 架构 
是 采用 一 组 服务 的 方式 来 构建 一 个 应 用 ， 服 务 独立 部 署 在 不 同 的 进程 
中 ， 不 同 服务 通过 一 些 轻 量 级 交互 机 制 来 通信 ， 例 如 RPC. HTTP 
等 ， 服 务 可 独立 扩展 伸缩 ， 每 个 服务 定义 了 明确 的 边界 ， 不 同 的 服务 
甚至 可 以 采用 不 同 的 编程 语言 来 实现 ， 由 独立 的 团队 来 维护 。 

微服 务 架 构 特 征 (Characteristics) 包括 如 下 这 些 特点 : 

1) 通过 服务 实现 组 件 化 

传统 实现 组 件 的 方式 是 通过 库 (library) ， 传 统 组 件 是 和 应 用 一 起 
运行 在 进程 中 ， 组 件 的 局 部 变化 意味 着 整个 应 用 的 重新 部 署 。 通 过 服 
务 来 实现 组 件 ， 意 味 着 将 应 用 拆散 为 一 系列 的 服务 运行 在 不 同 的 进程 
中 ， 那 么 单一 服务 的 局 部 变化 只 需 重 新 部 署 对 应 的 服务 进程 。 另 外 将 
服务 作为 组 件 可 以 更 明确 地 定义 出 组 件 的 边界 ， 因 为 服务 之 间 的 调用 
是 跨 进程 的 ， 清 晰 的 边界 和 职责 定义 是 设计 时 必须 考虑 的 。 

2) 按 业 务 能 力 来 划分 服务 与 组 织 团队 

康 威 定律 (Conway's law) 指出 ， 任 何 设计 系统 的 组 织 ， 最 终 产生 
的 设计 等 同 于 组 织 之 内 、 之 间 的 沟通 结构 。 

传统 开发 方式 中 ， 我 们 将 工程 师 按 技能 专长 分 层 为 前 端 层 、 中 间 
层 、 数 据 层 ， 前 端 对 应 的 角色 为 UI、 页 面 构建 师 等 ， 中 间 层 对 应 的 角 
色 为 服务 端 业务 开发 工程 师 ， 数 据 层 对 应 着 DBA 等 角色 。 事 实 上 传统 
应 用 设计 架构 的 分 层 结构 正 反 映 了 不 同 角 色 的 沟通 结构 。 而 微服 务 架 
构 的 开发 模式 不 同 于 传统 方式 ， 它 将 应 用 按 业 务 能 力 来 划分 为 不 同 的 
服务 ， 每 个 服务 都 要 求 在 对 应 业务 领域 的 全 栈 〈 从 前 端 到 后 端 ) 软件 
实现 ， 从 界面 到 数据 存储 到 外 部 沟通 协作 等 。 因 此 团队 的 组 织 是 跨 功 
能 的 ， 包 含 实现 业务 所 需 的 全 面 的 技能 。 近 年 兴起 的 全 栈 工 程 师 正 是 
因为 架构 和 开发 模式 的 转变 而 出 现 ， 当 然 具 备 全 栈 的 工程 师 其 实 很 
少 ， 但 将 不 同 领域 的 工程 师 组 织 为 一 个 全 栈 的 团队 就 容易 得 多 。 


3) 服务 即 产品 

传统 的 应 用 开发 都 是 基于 项 目 模式 的 ， 开 发 团队 根据 一 堆 功能 列 
表 开 发 出 一 个 软件 应 用 并 交付 给 客户 后 ， 该 软件 应 用 就 进入 维护 模 
式 ， 由 另 一 个 维护 团队 负责 ， 开 发 团队 的 职责 结束 。 而 微服 务 架 构 的 
倡导 者 提议 避免 采用 这 种 项 目 模式 ， 更 倾向 于 让 开发 团队 负责 整个 产 
品 的 全 部 生命 周期 。Amazon 对 此 提出 了 一 个 观点 : 

开发 团队 对 软件 在 生产 环境 的 运行 负 全 部 责任 ， 让 服务 的 开发 者 
与 服务 的 使 用 者 (客户 ) 形成 每 天 的 交流 反馈 ， 来 自 直接 客户 端的 反 
馈 有 助 于 开发 者 提升 服务 的 质量 。 

4) 智能 终端 与 哑 管 道 

微服 务 架构 抛弃 了 ESB 过 度 复杂 的 业务 规则 编排 、 消 息 路 由 等 。 
服务 作为 智能 终端 ， 所 有 的 业务 智能 逻辑 在 服务 内 部 处 理 ， 而 服务 间 
的 通信 尽 可 能 的 轻 量化 ， 不 添加 任何 额外 的 业务 规则 。 

5) 去 中 心 统 一 化 

传统 应 用 中 倾向 采用 统一 的 技术 平台 或 产品 来 解决 所 有 问题 。 不 
是 每 个 问题 都 是 钉子 ， 也 不 是 每 个 解决 方案 都 是 一 个 锤子 。 问 题 有 其 
具体 性 ， 解 决 方案 也 应 有 其 针对 性 。 用 最 适合 的 技术 方案 去 解决 具体 
的 问题 ， 在 大 一 统 的 传统 应 用 中 其 实 很 难 做 到 ， 而 微服 务 的 架构 意味 
着 ， 你 可 以 针对 不 同 的 业务 服务 特征 选择 不 同 的 技术 平台 或 产品 ， 有 
针对 性 的 解决 具体 的 业务 问题 。 

6) 基础 设施 自动 化 

单一 进程 的 传统 应 用 被 拆 分 为 一 系列 的 多 进程 服务 后 ， 意 味 着 开 
发 、 调 试 、 测 试 、 集 成 、 监 控 和 发 布 的 复杂 上 度 都 会 相应 增 大 。 必 须要 
有 合适 的 自动 化 基础 设施 来 支持 微服 务 架 构 模 式 ， 否 则 开发 、 运 维 成 
本 将 大 大 增加 。 

7)Design for failure 

正 因为 将 服务 独立 在 不 同 的 进程 中 后 ， 引 入 了 额外 的 失败 因素 。 
任何 时 刻 对 服务 的 调用 都 可 能 因为 服务 方 不 可 用 导致 失败 ， 这 就 要 求 
服务 的 消费 方 需要 优雅 的 处 理 此 类 错误 。 这 其 实 是 相对 传统 应 用 开发 
方式 的 一 个 缺点 ， 不 过 随 着 一 些 开 源 服 务 化 框架 的 出 现 ， 对 业务 开发 


人 员 而 言 适当 的 屏 亚 了 类 似 的 错误 处 理 ， 不 过 开发 人 员 依 然 需要 知道 
对 服务 的 调用 是 完全 不 同 于 进程 内 的 方法 或 水 数 调 用 的 。 

8) 进化 设计 

一 旦 采用 了 微服 务 架 构 模 式 ， 那 么 在 服务 需要 变更 时 我 们 要 特别 
小 心 ， 服 务 提供 者 的 变更 可 能 引发 服务 消费 者 的 兼容 性 破坏 ， 时 刻 并 
记 保持 服务 契约 (REDI) 的 兼容 性 。 对 于 解 耦 服务 消费 方 和 服务 提供 
方 ， 伯 斯 塔 尔 法 则 (Postel's law) 特别 适用 ， 即 发 送 时 要 保守 ， 接 收 时 
要 开放 。 

按照 伯 斯 塔 尔 法 则 的 思想 来 设计 实现 服务 调用 时 ， 发 送 的 数据 要 
更 保守 ， 意 味 着 最 小 化 的 传送 必要 的 信息 ， 接 收 时 更 开放 意味 着 要 最 
大 限度 的 容忍 信息 的 兼容 性 。 多 余 的 信息 不 认识 可 以 忽略 ， 而 不 应 该 
拒绝 或 抛 出 错误 。 

微服 务 架构 应 用 

采用 微服 务 架构 面临 的 第 一 个 问题 就 是 如 何 将 一 个 单一 应 用 拆 分 
为 多 个 服务 。 有 一 个 一 般 的 原则 是 ， 单 一 服务 提供 的 功能 是 可 以 独立 
被 蔡 换 和 升级 的 。 也 就 是 说 如 果 有 A 和 B 两 个 功能 ， 如 果 A 功能 发 生 
变化 时 同时 B 功能 也 需要 变化 ， 那 么 A 和 B 这 两 个 功能 应 该 被 划 在 一 
个 服务 中 。 

微服 务 架 构 应 用 的 成 功 经 验 近 年 已 越 来 越 多 ,例如 国外 的 
Amazon，Netflix， 国 内 如 阿里 都 采用 微服 务 架 构 取 得 了 很 多 正面 的 成 
功 案例 。 但 通过 上 文 所 述 微服 务 架构 特征 看 出 ， 其 实 微服 务 架 构 模 式 
有 利 有 浆 ， 需 要 根据 实际 的 业务 、 团 队 、 环 境 进行 仔细 权衡 利弊 。 其 
中 的 服务 拆 分 带 来 的 额外 开发 、 测 试 、 运 维 、 监 控 的 复杂 度 ， 在 现 有 
的 环境 、 团 队 下 是 否 能 够 很 好 的 支持 。 

另外 ， 有 人 可 能 会 说 ， 我 一 开始 不 采用 微服 务 架构 方式 ， 而 是 在 
单一 进程 内 基于 清晰 定义 的 模块 化 方式 ， 模 块 之 间 通 过 接口 调用 ， 到 
了 适当 阶段 ， 必 要 的 时 候 再 将 模块 拆 分 为 服务 。 其 实 这 个 想法 显得 过 
于 理想 ， 因 为 进程 内 良好 定义 的 接口 通常 不 是 很 好 的 服务 化 接口 。 一 
开始 没有 考虑 服务 化 的 设计 方法 ， 那 么 后 期 拆 分 时 依然 是 一 个 痛 藻 的 
过 程 。 

总 的 来 说 ， 面 向 服务 架构 是 一 种 思想 ， 当 然 对 于 大 系统 而 言 其 利 
必 大 于 尊 ， 而 系统 比较 小 的 时 候 育 目的 拆 分 和 服务 化 其 实 会 导致 整个 


维护 成 本 上 升 。 系 统 染 构 并 没有 一 成 不 变 的 套路 ， 也 不 必 完 全 遵循 某 
种 模式 。 一 切 都 在 实际 应 用 中 结合 具体 的 应 用 场景 。 应 该 说 是 “方法 
论 ” 的 具体 产物 。 


8.2.4 程序 隔离 技术 


CGroup 是 Control Groups 的 缩写 ， 是 Linux 内 核 提 供 的 一 种 可 以 限 
制 、 记 录 、 隔离 进 程 组 (process groups) 所 使 用 的 物力 资源 (如 cpu 
memory i/o 等 ) 的 机 制 。2007 年 进入 Linux 2.6.24 内 核 ，CGroups 不 是 全 
新 创造 的 ， 它 将 进程 管理 从 cpuset 中 剥离 出 来 ， 作 者 是 Google 的 Paul 
Menage。 CGroups 也 是 LXC 为 实现 虚拟 化 所 使 用 的 资源 管理 手段 。 

CGroup 是 将 任意 进程 进行 分 组 化 管理 的 Linux 内 核 功能 。CGroup 本 
身 是 提供 将 进程 进行 分 组 化 管理 的 功能 和 接口 的 基础 结构 ，IO 或 内 存 
的 分 配 控制 等 具体 的 资源 管理 功能 是 通过 这 个 功能 来 实现 的 。 这 些 具 
体 的 资源 管理 功能 称 为 CGroup 子 系统 或 控制 器 。CGroup 子 系统 有 控制 
内 存 的 Memory 控制 器 、 控 制 进程 调度 的 CPU 控制 器 等 。 运 行 中 的 内 
核 可 以 使 用 的 Cgroup 子 系统 由 /proc/cgroup 来 确认 。 

CGroup 提 供 了 一 个 CGroup 虚 拟 文件 系统 ， 作 为 进行 分 组 管理 和 各 
子 系统 设置 的 用 户 接口 。 要 使 用 CGroup ， 必 须 挂 载 CGroup 文 件 系统 。 
这 时 通过 挂 载 选项 指定 使 用 哪个 子 系统 。 

CGroup 相 关 概 念 解释 如 下 所 示 。 

(1) 任务 (task) 。 在 cgroups 中 ， 任 务 就 是 系统 的 一 个 进程 。 

(2) 控制 族群 (control group) 。 控 制 族群 就 是 一 组 按照 某 种 标 
准 划 分 的 进程 。Cgroups 中 的 资源 控制 都 是 以 控制 族群 为 单位 实现 。 一 
个 进程 可 以 加 入 到 某 个 控制 族群 ， 也 从 一 个 进程 组 迁移 到 另 一 个 控制 
族群 。 一 个 进程 组 的 进程 可 以 使 用 cgroups 以 控制 族群 为 单位 分 配 的 资 
源 ， 同 时 受到 cgroups 以 控制 族群 为 单位 设 定 的 限制 。 

(3) 层级 (hierarchy) 。 控 制 族群 可 以 组 织 成 hierarchical 的 形 
式 ， 既 一 颗 控 制 族群 树 。 控 制 族群 树 上 的 子 节点 控制 族群 是 父 节点 控 
制 族群 的 孩子 ， 继 承 父 控制 族群 的 特定 的 属性 。 

(4) 子 系统 (subsystem) 。 一 个 子 系统 就 是 一 个 资源 控制 器 ， 
比如 cpu 子 系统 就 是 控制 cpu 时 间 分 配 的 一 个 控制 器 。 子 系统 必须 附加 


(atach) 到 一 个 层级 上 才能 起 作用 ， 一 个 子 系统 附加 到 某 个 层级 以 
后 ， 这 个 层级 上 的 所 有 控制 族群 都 受到 这 个 子 系统 的 控制 。 

每 次 在 系统 中 创建 新 层级 时 ， 该 系统 中 的 所 有 任务 都 是 那个 层级 
的 默认 CGroup (我 们 称 之 为 Root CGroup， 此 CGroup 在 创建 层级 时 自动 
创建 ， 后 面 在 该 层级 中 创建 的 CGroup 都 是 此 CGroup 的 后 代 ) 的 初始 成 
员 ， 一 个 子 系统 最 多 只 能 附加 到 一 个 层级 ， 一 个 层级 可 以 附加 多 个 子 
系统 ， 一 个 任务 可 以 是 多 个 CGroup 的 成 员 ， 但 是 这 些 CGroup 必 须 在 不 
同 的 层级 。 系 统 中 的 进程 (5) 创建 子 进程 〈 任 务 ) 时， 该 子 任务 
自动 成 为 其 父 进程 所 在 CGroup 的 成 员 。 然 后 可 根据 需要 将 该 子 任务 移 
动 到 不 同 的 CGroup 中 ， 但 开始 时 它 总 是 继承 其 父 任 务 的 CGroup。 

如 图 8-2 所 示 的 CGroup 层 级 关系 显示 ，CPU 和 Memory 两 个 子 系统 
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图 8-2 CGroup 层 级 图 
实验 基于 Linux Centosv6.564 位 版 本 ，JDK1.7。 实 验 目 的 是 运行 一 
个 占用 CPU 的 Java 程 序 ， 如 果 不 用 CGroup 物 理 隔 离 CPU 核 ， 那 程序 会 
由 操作 系统 层级 自动 挑选 CPU 核 来 运行 程序 。 由 于 操作 系统 层面 采用 
的 是 时 间 片 轮 询 方式 随机 挑选 CPU 核 作 为 运行 容器 ， 所 以 会 在 本 机 器 
上 24 个 CPU 核 上 随机 执行 。 如 果 采 用 CGroup 进 行 物理 隔离 ， 我 们 可 以 
选择 某 些 CPU 核 作为 指定 运行 载体 。 


代码 清单 8-2 创建 一 个 占据 CPU 的 任务 
// 开 启 4 个 用 户 线程 ， 其 中 1 个 线程 大 量 占用 CPU 资源 ， 其 他 3 个 线程 则 处 于 空闲 状态 
public class HoldCPUMain { 
public static class HoldCPUTask implements Runnable{ 


@Override 
public void run() { 
// TODO Auto-generated method stub 
while (true) { 
double a = Math.random() *Math.random();//%/A CPU 
System.out.println (a); 


} 


public static class LazyTask implements Runnable{ 


@Override 
public void run() { 
// TODO Auto-generated method stub 

while (true) { 

try { 

Thread.sleep (1000); 

) catch (InterruptedException e) { 
// TODO Auto-generated catch block 

e.printStackTrace(); 


} // 空 闲 线程 


public static void main(String[] args) { 

for(int i=0;i<10;i++){ 

new Thread(new HoldCPUTask()).start(); 
} 


清单 8-1 所 示 程 序 会 启动 10 个 线程 ， 这 10 个 线程 都 在 做 占用 CPU 的 
计算 工作 ， 它 们 可 能 会 运行 在 1 个 CPU 核 上 ， 也 可 能 运行 在 多 个 核 上 ， 
由 操作 系统 决定 。 我 们 稍 后 会 在 Linux 机 器 上 通过 命令 在 后 台 运 行 清单 
1 程序 。 本 实验 需要 对 CPU 资源 进行 限制 ， 所 以 我 们 在 cpu_and_set 子 系 
统 上 创建 自己 的 层级 “zhoumingyao”。 


代码 清单 8-3 ”创建 自己 的 层级 
[root@facenode4 cpu and set]# ls -rlt 
总 用 量 0 

root root 3H 21 17:21 release agent 

3 月 21 17:21 notify on release 

3 H 21 17:21 cpu.stat 

3H 21 17:21 cpu.shares 

3H 21 17:21 cpuset.sched relax domain level 

3 A 21 17:21 cpuset.sched load balance 

3H 21 17:21 cpuset.mems 


3H 21 17:21 cpuset.memory spread slab 


-rw-r--r-- 


ed root root 


eyeexcey-- root root 


2rYwWep--f-- root root 


-Wt ss root root 


-YWw-L--t-- root root 


AEWA root root 


-LZWerfr--IÍ-- root root 


-TW-r--I-- root root 3 月 21 17:21 cpuset.memory spread page 


-rw-r--r-- 1 root root 3H 21 17:21 cpuset.memory pressure enabled 


二 了 一 一 root root 3 月 21 17:21 cpuset.memory pressure 


-Yw-r--f-- root root 3 月 21 17:21 cpuset.memory migrate 
3 月 21 17:21 cpuset.mem hardwall 
3 月 21 17:21 cpuset.mem exclusive 


3 H 21 17:21 cpuset.cpus 


PFW” root root 


a i < root root 


A root root 3 月 21 17:21 cpuset.cpu exclusive 


root root 3H 21 17:21 cpu.rt runtime us 
3 月 21 17:21 cpu.rt period us 
3 月 21 17:21 cpu.cfs quota us 


3 月 21 17:21 cpu.cfs period us 


-rw-r--r-- 
—rWw-r--n-- root root 
-rw-r--r-- 1 root root 
-XW-f--f-- root root 
3H 21 17:21 cgroup.procs 
3H 21 17:22 test 

3H 23 16:36 test1 

3 H 25 19:23 tasks 

3H 31 19:32 single 

3H 31 19:59 singlel 

3H 31 19:59 single2 

3H 31 19:59 single3 

4H 3 17:34 aaaa 


[root@facenode4 cpu and set]£$ mkdir zhoumingyao 


= root root 


drwxr-xr-x root root 


drwxr-xr-x root root 


-rw-r--r-- root root 


drwxr-xr-x root root 


drwxr-xr-x root root 


1 

1 

1 

1 

1 

1 

1 

1 

£ 

1 

1 

ii 

1 

ul 
-rw-r--r-- 1 root root 

1 
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1 

i 
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2 
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drwxr-xr-x 2 root root 
drwxr-xr-x 2 root root 
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drwxr-xr-x 3 root root 


[root@facenode4 cpu and set]# cd zhoumingyao 


{root@facenode4 zhoumingyao]# ls -rlt 


总 用 量 0 

-rw-r--r-- 1 root root 0 4 月 30 14:03 tasks 

-rw-r--r-- 1 root root 0 4 H 30 14:03 notify on release 

-r--r--r-- 1 root root 0 4 H 30 14:03 cpu.stat 

-rw-r--r-- 1 root root 0 4 H 30 14:03 cpu.shares 

-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.sched relax domain level 
-rw-r--r-- 1 root root 0 4 H 30 14:03 cpuset.sched load balance 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.mems 


-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset ,memory spread slab 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.memory spread page 
-r--r--r-- 1 root root 0 4 月 30 14:03 cpuset.memory pressure 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.memory migrate 
-rw-r--r-- l root root 0 4 月 30 14:03 cpuset.mem hardwall 
-rw-r--r-- l root root 0 4 月 30 14:03 cpuset.mem exclusive 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.cpus 

-rw-r--r-- 1 root root 0 4 月 30 14:03 cpuset.cpu exclusive 
-rw-r--r-- 1 root root 0 4A 30 14:03 cpu.rt runtime us 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpu.rt period us 
-rw-r--r-- 1 root root 0 4 月 30 14:03 cpu.cfs quota us 
-rw-r--r-- 1 root root 0 4A 30 14:03 cpu.cfs period us 
-r--r--r-- 1 root root 0 4 月 30 14:03 cgroup.procs 


通过 mkdir 命 令 新 建文 件 夹 zhoumingyao ， 由 于 已 经 预先 加 载 
cpu_and_set 子 系统 成 功 ， 所 以 当 文 件 夹 创建 完毕 的 同时 ，cpu_and_set 
子 系统 对 应 的 文件 夹 也 会 自动 创建 。 运 行 Java 程 序 前 ， 我 们 需要 确认 
cpu_and_set 子 系统 安装 的 目录 ， 如 清单 8-4 所 示 。 


代码 清单 8-4 确认 目录 
[root@facenode4 zhoumingyao]# lscgroup 
cpuacct: / 
devices:/ 
freezer:/ 
net cls:/ 
blkio:/ 
memory: / 
memory:/test2 
cpuset, cpu: / 
cpuset, cpu: /zhoumingyao 
cpuset, cpu: /aaaa 
cpuset, cpu: /aaaa/bbbb 
cpuset, cpu:/single3 
cpuset, cpu:/single2 
cpuset, cpu:/singlel 


cpuset, cpu: /single 


cpuset, cpu:/testl 


cpuset, cpu: /test 


输出 显示 cpuset_cpu 的 目录 是 cpuset，cpu: /zhoumingyao, ， 由 于 本 
实验 所 采用 的 Java 程 序 是 多 线程 程序 ， 所 以 需要 使 用 cgexec 命 令 来 帮助 
启动 ， 而 不 能 如 网 络 上 有 些 材料 所 述 ， 采 用 java -jar 命 令 启动 后 ， 将 pid 
进程 号 填 入 tasks 文 件 即 可 的 错误 方式 。 清 单 8-4 即 采用 cgexec 命 令 启动 
java 程 序 ， 需 要 使 用 到 清单 8-4 定 位 到 的 cpuset_cpu 目 录 地 址 。 


代码 清单 8-5 运行 Java 程序 
[root@facenode4 zhoumingyao]# cgexec -g cpuset,cpu:/zhoumingyao java -jar 


test.jars 


我 们 在 cpuset.cpus 文 件 中 设置 需要 限制 只 有 0-10 这 11 个 CPU 核 可 以 
被 用 来 运行 上 述 清 单 4 启 动 的 Java 多 线程 程序 。 当 然 CGroup 还 可 以 限制 


具体 每 个 核 的 使 用 百分比 ， 这 里 不 再 做 过 多 的 描述 ， 请 读者 自行 翻阅 
CGroup 官方 材料 。 

接 下 来 ， 通 过 TOP 命 令 获 得 清单 4 启动 的 Java 程 序 的 所 有 相关 线程 
ID， 将 这 些 ID 写 入 到 Tasks 文 件 。 


代码 清单 8-6 ”设置 CPU 线程 
[root@facenode4 zhoumingyao]# cat tasks 
2656 
2657 
2658 
2659 
2660 
2661 
2662 
2663 
2664 
2665 
2666 
2667 
2668 
2669 
2670 
2671 
2672 
2673 
2674 
2675 
2676 
2677 
2678 
2679 
2680 
2681 
2682 
2683 
2684 
2685 
2686 
2687 
2688 
2689 
2714 
2:15 
2716 
2718 


全 部 设置 完毕 后 ， 我 们 可 以 通过 TOP 命 令 查看 具体 的 每 一 颗 CPU 核 
上 的 运行 情况 ， 发 现 只 有 0-10 这 11 颗 CPU 核 上 有 计算 资源 被 调用 ， 可 以 
进一步 通过 TOP 命 令 确 认 全 部 都 是 清单 8-4 所 启动 的 Java 多 线程 程序 的 


代码 清单 8-7 
top - 14:43:24 up 44 days, 59 nin, 
Tasks: 715 total, 


Cpu0 
Cpul 
Cpu2 
Cpu3 
Cpu4 
Cpu5 


Cpu6 : 


Cpu7 
Cpu8 
Cpu9 


Cpuld : 
Cpull : 
Cpul2 : 
Cpul3 : 
Cpul4 : 
Cpul5 : 
Cpul6 : 
Cpul7 : 
Cpul8 : 
Cpul9 : 
Cpu20 : 
Cpu2l : 
Cpu22 : 
Cpu23 : 
32829064k total, 


Mem: 


运行 结果 


0.7$us, 
1.0$us, 
0.3%us, 
1.0$us, 
0.0$us, 
1.3%us, 
3.8$us, 
7.7$us, 
4,8%us, 
0.0%us, 
0.0%us, 
0.0%us, 
0.05us, 
0.0%us, 
0.0%us, 
0.0%us, 
0.0%us, 
0.0%us, 
0.05us, 
0.0%us, 
0.0%us, 
0.3%us, 
0.0%us, 


0.0%us, 


6 users, 


1 running, 714 sleeping, 


0.3%sy, 
0.7%sy, 
0.3%sy, 
1, 6%sy, 
0.0$sy, 
1.95sy, 
5.45sy, 
9.95sy, 
6.1%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0. 05sy, 
0.0%sy, 
0.0%sy, 
0.0%sy, 
0.3%sy, 
0.0%sy, 
0.0%sy, 


Swap: 24777720k total, 


c» 


Oni, 99.0%id, 
.0%ni, 98.3%id, 
„Osni, 99.3%id, 
.Osni, 97.5%id, 
Oni, 100.0%id, 
„Osni, 96.8%id, 
.0%ni, 90.8%id, 
„Osni, 82.4%id, 
.0%ni, 89.1%id, 
O0%ni,100.0%id, 
Oni, 100. 05id, 
.0$ni,100.051id, 
.O$ni, 100. 05id, 
0.0%ni, 72.8%id, 
0.0$n1,100.05id, 
0.0%ni,100.0%1id, 
0.0%ni,100.0%1d, 
0.0%ni,100.0%id, 
0.0%ni,100.0%id, 
0.0%ni,100.0%id, 
0.0%ni,100.0%id, 
0.0%ni, 99.3%id, 
0.0%ni,100.0%id, 
0.0%ni,100.0%id, 


CS C39 di» € oOo c» A C c» DO c c 


load average: 0.47, 0.40, 0.33 


0 stopped, 


0.0$wa, 
0.0$wa, 
0.0%wa, 
0.0$wa, 
0.0$wa, 
0.0%wa, 
0.0$wa, 
0.0%wa, 
0.0%wa, 
0.0%wa, 


0, 
0, 
0. 


Oswa, 
0$wa, 


0$wa, 


0.09$wa, 


c» c» CC c» c c c» c» 
- - - . - - 


.05wa, 


0$wa, 
0$wa, 
0$wa, 
0$wa, 
0wa, 


0$wa, 


.05wa, 

0. 

0. 

5695012k used, 27134052k free, 
0k used, 24777720k free, 


0wa, 


0$wa, 


0.0%hi, 
0.0%hi, 
0.0%hi, 
0.0$hi, 
0.0$hi, 
0.0%hi, 
0.0%hi, 
0.0%hi, 
0.0%hi, 
0.0%hi, 
0.0%hi, 


0.0%hi, 


0 zombie 


0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 
0.0%si, 


0.0%si, 
0.0%si, 


0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0$st 
0.0%st 


0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0%st 
0.0$st 
0.0%st 


533516k buffers 


3326940k cached 


总 体 上 来 说 ，CGroup 的 使 用 方式 较为 简单 ， 目 前 主要 的 问题 是 网 
络 上 已 有 的 中 文 材料 缺少 详细 的 配置 步骤 ， 一 旦 读者 通过 反复 实验 ， 
掌握 了 配置 方式 ， 使 用 上 应 该 不 会 有 大 的 问题 。 


8.2.5 团队 并 行 开发 准则 


我 们 先 来 谈 谈 什 么 是 并 行 开发 的 风险 ? 并 行 开 发 最 大 的 风险 就 是 
风险 扩散 ， 本 来 只 是 一 段 程序 的 错误 或 异常 ， 逐 步 疲 及 一 个 功能 ,一 
个 模块 ， 甚 至 到 最 后 毁坏 了 整个 项 目 ， 为 什么 并 行 开 发 就 有 这 个 风险 
呢 ? 一 个 团队 ，20 人 开发 ， 各 人 负责 不 同 的 功能 模块 ， 甲 负责 汽车 类 
的 建造 ， 乙 负责 司机 类 的 建造 ， 在 甲 没 有 完成 的 情况 下 ， 乙 是 不 能 完 
全 地 编写 代码 的 ， 缺 少 汽 车 类 ， 编 译 器 根本 就 不 会 让 你 通过 ! 在 缺少 
Benz 类 的 情况 下 ，Driver 类 能 编译 吗 ? 更 不 要 说 是 单元 测试 了 ! 在 这 种 
不 使 用 依赖 倒置 原则 的 环境 中 ， 所 有 的 开发 工作 都 是 * 单 线程” 的 ， 甲 
做 完 ， 乙 再 做 ， 然 后 是 丙 继 续 ...， 这 在 90 年 代 “ 个 人 英雄 主义 ”编程 模 
式 中 还 是 比较 适用 的 ， 一 个 人 完成 所 有 的 代码 工作 ， 但 在 现在 的 大 中 
型 项 目 中 已 经 是 不 能 完全 胜任 了 ， 一 个 项 目 是 一 个 团队 的 协作 结果 ， 
一 个 “英雄 ”再 牛 也 不 可 能 了 解 所 有 的 业务 和 所 有 的 技术 ， 要 协作 就 要 
并 行 开 发 ， 要 并 行 开 发 就 要 解决 模块 之 间 的 项 目 依赖 关系 。 

假设 一 个 有 4 名 编程 人 员 的 小 型 开发 团队 (以 下 简称 “TJRP 开 发 
2H") ， 成 员 Tom、Jason、Robert 和 Pat 分 别 负责 4 个 模块 ， 按 照 传 统 的 
软件 开发 模式 ， 开 发 将 经 历 编程 - 连 调 -测试 -发 布 4 个 阶段 。 如 果 最 初 的 
设计 正确 ， 并 且 ， 四 个 开发 人 员 都 是 资深 程序 员 而 且 配 合 默 扫 ， 那 么 
这 个 模式 将 会 运转 民 好 。 然 而 遗憾 的 是 ，Pat 刚 刚 参 加 工作 不 久 ， 对 于 
设计 师 撰 瑟 的 设计 文档 的 理解 不 够 透彻 ， 而 Robert 则 自作 主张 地 对 设计 
进行 了 一 些 修正 ， 更 糟糕 的 是 ， 项 目 组 会 议 的 时 候 ， 这 些 问 题 没 有 及 
时 地 被 暴露 出 来 ， 导 致 Pat 和 Robert 代 码 在 设计 上 的 “分 歧 ” 越 来 越 大 。 
结果 进入 联 调 的 阶段 ，Pat 和 Robert 发 生 了 激烈 的 争执 ， 在 吵 得 不 可 开 
交 之 后 ， 项 目 经 理 终于 让 4 个 人 坐 到 了 一 起 来 解决 问题 ， 最 后 ， 连 调 阶 
段 整整 多 伦 了 一 僧 的 时 间 。 

但 倒霉 的 事情 还 没有 结束 。Jason 在 测试 中 发 现 ， 原 本 正常 的 代码 
行为 被 改变 了 ， 并 且 ， 他 惊讶 地 发 现代 码 被 某 个 “别人 ”改过 ， 在 翻 箱 
倒 柜 地 找 出 某 份 正 常 版 本 的 副本 之 后 ， 他 又 发 现 , “别人 ”修改 中 的 某 


些 地 方 是 必要 的 。 代 码 合并 和 重新 测试 使 得 测试 阶段 足 足 花 掉 了 原先 
预想 3 倍 的 时 间 。 

可 怜 的 Tom 运 气 更 差 ， 作 为 主要 的 代码 复审 人 员 ， 他 不 得 不 阅读 所 
有 的 代码 。Robert 和 Pat 的 争吵 导致 了 大 量 的 代码 变动 ， 他 不 得 不 重新 
审核 代码 ， 而 Jason 的 代码 合并 引发 的 新 问题 又 让 他 不 得 不 分 神 去 帮助 
Jason 进 行 调整 。 

最 后 的 结果 是 ， 软 件 开 发 的 成 本 是 预期 的 2.4 倍 ， 发 布 时 间 也 拖 后 
了 不 少 。 我 并 不 是 在 开玩笑 ， 上 面 所 讲 的 是 一 个 发 生 在 那 家 安全 软件 
公司 的 真实 故事 。 他 们 的 技术 经 理 介绍 ， 在 施行 了 规范 的 开发 制度 ， 
以 及 启用 并 行 版 本 控制 系统 之 后 ， 他 们 认为 开发 达到 了 一 个 全 新 的 水 
平 。 并 行 版 本 控制 系统 本 身 并 没有 产生 任何 代码 ， 但 由 于 使 用 这 样 的 
系统 ， 开 发 的 效率 被 大 大 地 提高 了 。 

所 谓 版 本 控制 其 实 并 不 是 什么 复杂 的 概念 。 对 于 开发 活动 的 绝 大 
多 数 参 与 者 来 说 ， 版 本 控制 系统 在 某 种 意义 上 能 够 帮助 他 们 做 好 开发 
过 程 中 的 记录 工作 ， 并 且 ， 通 过 保存 文件 在 不 同时 期 的 版 本 ， 交 付 工 
程 师 和 代码 复审 员 能 够 很 容易 地 缩小 搜索 问题 代码 的 范围 ， 而 程序 员 
则 可 以 通过 这 样 的 系统 更 好 地 并 行 协作 。 一 般 来 说 ， 源 代码 的 版 本 控 
制 系统 能 够 实现 以 下 一 些 最 基本 的 功能 。 

m 保存 任意 一 个 源 代码 文件 的 不 同 版 本 。 

加 记录 修改 者 、 修 改 原因 。 

m 当 两 个 用 户 同 时 修改 一 个 文件 时 ， 尽 可 能 地 自动 合并 修改 ; 在 不 
能 合并 时 ， 给 出 提示 。 

m 比较 不 同 版 本 之 间 ， 或 与 本 地 副本 之 间 的 差异 。 

m 获取 最 新 版 本 的 全 部 源 代码 供 测 试 ， 并 允许 回 退 到 所 保存 的 源 代 
码 的 任意 版 本 。 

m 创建 代码 分 支 ， 便 于 软件 发 布 和 后 期 维护 (后 面 将 会 提 到 ) ; 新 
的 代码 可 以 合并 到 这 些 分 支 中 。 

m 对 不 同 的 源 代码 给 出 标记 ， 方 便 日 后 审查 。 

m 访问 控制 : 阻止 未 经 授权 的 修改 和 查阅 。 

我 们 知道 ， 技 术 不 是 解决 一 切 问 题 的 灵丹妙药 ， 但 是 谁 也 不 会 否 
认 大 规模 的 机 械 化 生产 的 效率 高 于 人 拉 启 打 的 手工 业 作 坊 ， 一旦 运用 


得 当 ， 技 术 将 极 大 地 改善 我 们 的 工作 和 生活 。 我 们 可 以 看 到 ， 上 面 的 
功能 有 效 地 解决 了 TJRP 开 发 组 所 面临 的 绝 大 部 分 问题 ， 例 如 。 

m 由 于 能 够 同时 修改 代码 ， 并 获取 对 方 的 修改 ，Pat 和 Robert 能 够 有 
效 地 、 尽 早 地 进行 沟通 。 

m 促进 开发 者 之 间 的 交流 ， 每 一 个 修改 都 必须 给 出 原因 ， 并 记录 提 


m 测试 和 连 调 可 以 尽早 开始 ， 避 免 模块 之 间 的 不 兼容 在 最 后 阶段 被 
暴露 出 来 而 阻碍 发 布 。 
人 
/由 大 。 

m 代码 复审 可 以 针对 某 一 代码 分 支 进行 ， 从 而 ， 人 允许 一 些 开发 者 持 
续 地 开发 下 一 个 版 本 ， 而 稳定 的 代码 则 可 以 交付 给 用 户 。 

更 进一步 ， 以 管理 者 的 角度 ， 还 有 了 一 些 额 外 的 好 处 ， 如 。 

m 每 日 构建 和 测试 能 够 让 项 目 经 理 更 好 地 把 握 工 程 的 进度 。 

m 谁 作 了 多 少 工 作 ， 谁 工作 的 更 出 色 ， 可 以 在 版 本 控制 系统 中 清晰 
地 体现 。 

曙 分 工 明 确 ， 通 过 访问 控制 ， 可 以 避免 不 了 解 整个 代码 体系 的 开发 
人 员 偶 然 的 错误 修改 导致 的 全 盘 骨 溃 。 

m 更 重要 的 是 ， 版 本 控制 系统 中 将 保持 大 量 的 开发 经 验 ， 这 对 于 一 
个 开发 团队 来 说 是 一 笔 无 价 的 财富 。 

我 们 可 以 看 到 ， 上 述 改进 集中 地 体现 了 一 个 重要 的 思想 ， 即 及 时 
沟通 以 预防 问题 的 出 现 ， 尽 早 发 现 、 尽 早 解决 问题 ; 明确 奖惩 制度 ， 
激发 开发 人 员 的 积极 性 。 


8.3 与 编程 无 关 


这 一 小 节 的 内 容 与 程序 优化 无 天， 但 是 作者 个 人 认为 ， 一 个 程序 
员 的 气质 是 与 生 俱 来 + 梦想 + 坚持 + 机 遇 组 成 的 ， 所 以 想 和 大 家 分 享 一 下 
自己 对 于 工程 师 品 格 、 工 程 师 能 力 拓 展 、 工 程 师 思维 方法 拓展 等 方面 
的 一 些 自己 的 认 知 。 


8.3.1 工程 师 品 格 


写 到 了 本 文 的 最 后 ， 作 者 个 人 感觉 ， 再 多 的 性 能 优化 经 验 、 案 
例 ， 如 果 疫 有 人 去 阅读 、 尝 试 ， 都 不 会 起 多 大 的 作用 ， 所 以 工程 师 个 
人 的 职业 规划 、 修 乔 、 品 格 ， 还 是 非常 重要 的 ， 只 有 内 心 充 满 着 技术 
情节 的 工程 师 ， 才 可 能 会 重视 程序 的 整体 性 能 优化 策略 。 一 般 来 说 ， 
工程 师 品格 包括 如 下 几 点 。 

(1) 写 代码 、 看 别人 代码 和 文档 的 激情 ， 如 果 只 是 因为 这 份 工 作 
可 以 赚钱 ， 那 我 觉得 你 的 工程 师 道 路 不 会 太 长 ， 你 的 技术 造 请 也 不 会 
很 高 。 

(2) 我 读书 的 时 候 ， 自 习 室 那 是 要 抢 的 ， 大 家 都 在 努力 学 习 ， 本 
科 4 年 至 少 也 应 该 写 10 万 行 代码 。 现 在 我 面试 的 时 候 ， 问 985 大 学 即将 
踏 入 社会 的 研究 生 ,“ 你 热爱 编程 吗 ? ”你 会 每 天 晚上 自学 ， 周 末 到 公 
司 上 自己 加 班 吗 ? ”我 很 少 收 到 肯定 的 答复 。 没 有 人 喜欢 一 天 到 晚 学 习 ， 
但 是 想 要 成 为 技术 大 牛 ， 只 有 不 断 学 习 ， 让 技术 成 为 你 的 爱好 ， 没 有 
捷径 。 

(3) 天 赋 ， 就 是 所 谓 的 聪明 。 个 人 认为 ， 好 的 程序 员 通 常 可 能 是 
你 认识 的 人 里 最 聪明 的 那个 ， 而 且 出 乎 意料 的 ， 好 的 程序 员 可 能 不 是 
我 们 通 单 想象 的 那样 不 善 言辞 。 个 人 感觉 ， 好 的 程序 员 一 般 逻 辑 思 维 
能 力 很 强 ， 可 能 知识 领域 会 跨 域 多 个 领域 ， 比 如 浙江 大 学 已 故 的 陈 教 
授 天 洲 ， 心 理学 、 计 算 机 学 都 非常 精通 ， 即 便 患 病 期 间 还 在 国际 顶级 
期 刊 上 发 表 了 3 篇 顶级 的 医学 文章 ， 陈 教授 安息 ! | ! 

(4) 好 的 程序 员 通 常 有 自己 的 私人 的 一 些 研究 、 爱 好 、 项 目 ， 而 
这 些 大 多 数 情况 下 他 们 不 会 写 在 简历 上 ， 但 表现 出 来 却 可 能 恰恰 是 他 
的 潜能 、 深 度 和 后 劲 所 在 。 

(5) 技术 多 样 性 、 先 进 性 ， 在 多 种 技术 方向 都 有 涉及 ， 而 且 对 多 
种 技术 的 优 务 有 个 人 独到 的 见解 ， 喜 好 尝试 新 鲜 技术 。 云 计算 、 大 数 
据 技术 不 就 是 这 样 产生 的 吗 。 

(6) 基本 上 还 是 忽略 证 书 吧 ， 高 手 哪 有 时 间 去 考证 书 ， 有 这 个 闲 
工夫 还 不 如 多 做 点 东西 出 来 ， 多 写 点 文章 呢 。 

当然 ， 以 上 6 点 可 能 有 点 片面 ， 请 读者 自己 多 多 体会 ， 也 欢迎 微 信 
讨论 ， 本 文 作 者 微 信 号 michael tec， 欢 迎 添 加 。 


8.3.2 如 何 成 为 技术 大 牛 


当 一 个 程序 员 的 技术 能 力 和 解决 问题 的 能 力 达到 一 定 水 平 之 后 ， 
他 就 能 够 轻松 胜任 某 些 开发 任务 、 解 决 特定 实际 间 题 ， 从 而 给 用 户 带 
来 某 方 面 的 便利 。 他 的 能 力 与 他 接触 到 的 问题 匹配 ， 此 时 程序 员 处 于 
工作 满意 度 较 高 的 状态 ， 这 个 舒适 区 的 大 小 是 由 他 解决 问题 能 力 的 大 
小 定义 和 界定 的 。 什 么 时 候 挑战 的 情况 开始 发 生 呢 ? 当 问 题 超出 程序 
员 先 有 技能 和 经 验 说 明 ， 程 序 员 能 看 到 并 了 解 ， 但 还 不 能 解决 ， 这 个 
时 候 随时 都 可 能 给 程序 员 带 来 挑战 的 感觉 。 这 还 只 是 挑战 而 已 ， 如 果 
我 们 引入 了 一 个 全 新 的 编程 语言 ， 需 要 让 程序 员 在 有 限时 间 内 快速 掌 
握 该 技能 ， 那 么 这 时 才 会 进入 真正 的 挑战 区 域 ， 为 了 与 前 面 的 挑战 区 
相 区 别 ， 我 们 定义 它 为 未 知 区 域 。 对 大 多 数 程序 员 来 讲 ， 未 知 即 痛 
可。 这 个 区 域 往往 是 程序 员 看 不 清 或 看 不 到 的 ， 是 百 募 大 三 角 的 一 片 
未 知 而 神秘 的 区 域 ， 贸 然 跳 入 ， 可 能 折 副 沉 沙 钳 羽 而 归 。 假 如 一 个 程 
序 员 愿 意 跳出 舒适 区 ， 踏 入 挑战 区 ， 接 受 一 定 的 不 适 ， 那 他 就 能 够 有 
机 会 拓展 他 的 能 力 ， 将 自己 的 舒适 区 扩展 得 更 大 ， 他 的 舒适 区 就 会 变 
大 ， 挑 战区 也 会 跟着 变 大 ， 未 知 区 也 会 变 大 ， 这 也 是 符合 人 类 认 知 规 
律 的 : 知道 得 越 多 ， 未 知 的 也 越 多 。 如 果 一 个 程序 员 连 轻微 不 适 都 不 
愿意 接受 ， 那 他 就 会 渐渐 故 步 目 封 ， 沙 后 于 别人 ， 沙 后 于 时 代 ， 渐 渐 
被 这 个 日 新 月 异 的 时 代 所 抛弃 ， 成 为 一 个 别人 眼中 没什么 用 的 老家 
伙 。 

一 个 程序 员 的 能 力 ， 是 可 以 通过 锻炼 不 断 变 强 的 。 就 像 人 的 肌 
Al, 一段 时 间 让 锻炼 强度 超 负 奏 一 点 ， 肌 肉 变 得 比 原来 强 了 ， 就 再 起 
负 春 一点， 通过 这 样 的 螺旋 式 递 进 ， 肌 肉 就 会 越 来 越 强 。 程 序 员 也 是 
一 样 的 ， 你 的 学 习 能 力 、 代 码 能 力 、 设 计 能 力 、 沟 通 能 力 、 管 理 能 
等 ， 都 是 可 以 通过 锻炼 来 加 强 的 〈 但 我 们 也 得 考虑 一 个 人 适合 做 什 
么 ， 如 果 他 没有 某 方面 的 才干 ， 昌 然 通过 锻炼 也 可 以 加 强 ， 但 违背 天 
性 的 事 儿 通常 为 事倍功半 ) 。 在 软件 开发 过 程 中 ， 一 个 程序 员 ， 他 会 
什么 语言 懂 什么 框架 水 平 如 何 ， 自 己 心里 有 数 ， 项 目 经 理 通过 他 的 表 
现 也 认为 自己 心里 有 数 。 那 么 在 有 新 的 项 目 要 做 时 ， 通 常 的 做 法 是 ， 
哪个 程序 员 熟 悉 实 现 Tx 任 务 相 关 的 拷 术 ， 就 让 这 个 程序 员 做 Tx 任务 ， 
这 通常 又 是 出 于 交付 期 、 生 产 率 、 成 本 等 各 方面 的 考虑 。 在 这 种 情况 
下 ， 每 个 人 都 做 自己 驾轻就熟 的 事情 ， 对 整个 项 目 来 讲 ， 自 然 是 最 经 


济 的 。 可 是 对 程序 员 自 己 来 讲 ， 却 是 不 经 济 的 。 因 为 你 无 法 接受 新 的 
挑战 ， 你 的 能 力 边界 的 拓展 就 会 很 慢 。 所 以 ， 合理 的 情况 是 ， 项 目 经 
理 在 划分 任务 时 ， 要 对 程序 员 负 责 ， 既 给 一 个 程序 员 能 轻松 完成 的 任 
务 ， 也 要 给 他 需要 费 点 儿 劲 儿 才 能 完成 的 任务 ， 通 过 具有 挑战 性 的 任 
务 来 锻炼 这 个 程序 员 ， 让 他 更 好 更 快 的 成 长 。 但 是 这 样 做 的 管理 成 本 
太 高 ， 所 以 ， 现 实 当 中 ， 很 少 公司 的 项 目 经 理会 主动 这 么 做 (RB 
人 和 手 take 某 个 任务 时 会 被 动 这 么 做 ) 。 鉴 于 这 种 现实 ， 作 为 程序 员 自 
己 ， 如 果 你 想 更 快 地 成 长 ， 就 要 表现 得 勇敢 一 些 ， 主 动 走 到 挑战 区 
域 ， 去 抢 具有 挑战 性 的 任务 。 一 旦 你 拿 到 了 对 你 来 讲 具 有 挑战 性 的 任 
务 ， 虽 然 你 会 为 此 位 精 竭 虑 ， 昌 然 你 可 能 为 此 加 班 ， 虽 然 你 可 能 为 此 
在 别人 看 不 见 的 地 方 付出 ， 但 是 你 拥有 了 机 会 和 更 多 可 能 性 ， 如 果 你 
顺利 完成 了 ， 那 你 的 舒适 区 会 扩大 ， 你 接触 新 挑战 的 机 会 也 会 变 大 ， 
你 就 进入 了 良性 循环 ， 你 会 越 来 越 强大 。So， 某 个 技术 没 搞 过 ? 不 是 
问题 。 某 个 语言 没 学 过 ? 不 是 问题 。 软 件 结 构 太 复杂 ， 一 时 掌控 不 
1? 不 是 问题 。 业 务 不 熟悉 ? 不 是 问题 。 

在 渴望 成 就 自我 的 程序 员 眼 里 ， 问 题 即 机 会 。 只 有 抓 住 机 会 ， 我 
们 解决 问题 的 能 力 才 会 在 痛苦 的 历练 中 像 雪 球 一 样 越 深 越 大 。 


8.3.3 编程 方法 分 享 


编程 是 个 实在 活 ， 千 万 不 要 以 为 买 了 一 堆 书 ， 你 就 能 自动 成 为 大 
牛 ， 你 必须 耐心 地 把 这 些 书 看 完 ， 不 断 练习 、 不 断 思考 ， 这 样 你 才 有 
机 会 成 为 大 牛 。 

对 于 初学 者 来 说 ， 我 觉得 基础 知识 非常 重要 ， 而 这 些 基础 知识 不 
能 光 靠 记 忆 ， 记 忆 是 不 可 靠 的 ， 还 是 要 学 会 自我 思考 ， 理 解 编程 、 设 
计 的 精髓 。 这 就 好 像 我 们 小 时 候 背 乘法 口 扇 ， 老 师 天 天 追 在 屁股 后 面 


让 我 们 背 ， 光 死 背 能 背 出 来 吗 ? 我 还 记得 读 高 中 时 候 化 学 老师 让 我 们 
把 元 素 周 期 表 全 部 背诵 下 来 ， 差 一 点 就 磨 炙 了 我 的 化 学 热情 。 


学 习 一 门 弱 类 型 的 编程 语言 ， 不 要 先 学 习 那 种 具有 强制 类 型 的 、 
面向 对 象 的 编程 语言 。 严 格 而 言 ， 如 果 有 人 对 你 提 到 class (类 ) 或 继 
承 ， 那 么 你 就 应 该 去 选择 其 他 的 途径 了 。 虽 然 我 认同 类 和 继承 相关 近 
术 是 软件 开发 中 必 不 可 少 的 ， 但 是 我 强烈 认为 它们 不 应 该 是 初学 者 的 


选择 。 


考虑 到 这 一 点 ， 这 里 有 一 些 具体 的 建议 给 那些 正在 学 习 或 准备 学 
习 Web 应 用 开发 的 初学 者 。 实 际 上 ， 说 得 更 远 点 更 抽象 点 ， 这 就 是 一 个 
如 何 开 始 学 习 软 件 开发 的 一 个 好 计划 。 很 显然 ， 这 不 是 一 个 适合 所 有 
人 的 计划 ， 但 是 我 认为 它 一 定 适合 大 部 分 初学 者 。 鉴 于 此 ， 我 认为 
JavaScript 和 Java 是 对 于 初学 者 而 言 最 理想 的 编程 语言 ， 因 为 JS 解释 器 
在 绝 大 部 分 浏览 器 上 都 可 用 ， 而 Java 只 需要 安装 JDK 和 Eclipse 这 样 的 
IDE 工 具 就 可 以 直接 调试 ， 再 则 JavaScript 的 面向 对 象 特性 并 不 是 强制 型 
的 ， 并 且 无 论 Java 或 JavaScript， 它 们 都 在 工业 界 被 广泛 使 用 。 

以 JavaScript 为 例 ， 说 得 更 具体 点 ， 我 建议 你 以 这 个 顺序 学 习 。 

学 习 如 何 打 印 出 一 些 东 西 ， 学 习 如 何 声 明和 定义 变量 ， 学 习 基 本 
算术 运算 操作 (包括 余数 操作 ) ， 学 习 循 环 (特别 是 for 循 环 ) ， 学 习 
把 抽象 重复 的 代码 写成 函数 ， 学 习 字 符 串 和 用 循环 操作 字符 串 ， 学 习 
数组 和 数组 的 循环 方法 (特别 是 foreach 循 环 ) ， 学 习 创建 和 操作 对 象 
数据 集 。 记 住 上 面 的 这 些 并 每 天 写 一 个 程序 来 实践 ， 直 到 这 些 都 轻 而 
易 举 地 想起 来 。 学 习 Git 的 基本 操作 ， 学 习 通过 命令 行使 用 Git。 这 意味 
着 要 先 学 习 四 个 Unix/Linux 命 令 (ls，pwd，mkdir，cd) 。 当 学 习 了 这 
几 个 命令 ， 也 就 学 会 了 以 “ 树 型 ?或 层次 结构 的 呈现 方式 查询 文件 系 


统 。 


一 旦 你 掌握 了 上 面 的 几 个 Unix/Linux 命 令 ， 并 会 从 命令 行进 入 文件 
系统 ， 你 就 应 该 学 几 个 基础 的 Git 命 令 。 主 要 是 git init, git status, git 
add and git commit。 一 旦 你 掌握 了 Git 的 基本 操作 ， 在 学习 下 面 的 技术 
时 将 其 集成 到 你 的 工作 流 中 。 学 习 HTML 基础 ， 能 够 赁 记忆 创建 简单 的 
HTML 页面 。 学 习 DOM 和 如 何 理解 HTML 作为 指定 的 分 层 树 结构 。 人 花 
点 时 间 来 思考 它 如 何 关系 到 你 在 前 面 步 又 中 学 到 的 分 层 文件 系统 。 学 
习 CSS 选 择 器 ， 了 解 它 如 何 让 你 选 定 DOM 的 某 些 部 分 。 了 解 DOM 元 素 
之 间 的 关系 。 了 解 一 个 DOM 元 素 作为 另 一 个 DOM 元 素 的 父 元 素 或 子 元 
素 的 含义 。 理 解 这 与 后 代 和 祖先 之 间 的 关系 有 什么 不 同 。 记 住 选择 器 
可 以 让 你 通过 这 些 关 系 来 选 定 某 些 元 素 。 学 习 jQuery， 并 主要 专注 于 
DOM 的 操作 能 力 。 学 会 用 jQuery 对 DOM 插 入 或 删除 元 素 ， 实 践 可 视 化 
如 何 影响 用 DOM 定 义 的 树 型 结构 。 实 践 jQuery 中 的 事件 处 理 和 DOM 操 
fF 〈 比 如 ， 实 践 操作 DOM 当 用 户 点 击 某 个 东西 ， 或 在 指定 的 时 间 间 
m) 。 多 练习 JavaScript 对 象 ， 并 把 它们 当 作 可 变 的 聚合 器 。 学 习 如 何 
用 JavaScript 来 表示 更 复杂 的 数据 而 不 是 基本 数据 类 型 。 学 会 应 用 并 操 


作 这 些 数据 结构 。 理 解 并 定义 JSON、 理 解 它 如 何 与 JavaScript 对 象 相关 
联 。 学 会 使 用 jQuery 的 geUJSON 函 数 从 文件 中 获取 数据 到 JavaScript 对 象 
中 。 使 用 类 似 的 技术 ， 用 一 个 简单 的 JSONP API 去 练习 用 AJAX 拉 取 数 
据 。 练习 向 DOM 插 入 和 删除 这 个 数据 。 在 这 个 阶段 ， 做 一 个 简单 的 幻 
灯 片 来 循环 播放 Flickr 图 片 ， 这 将 是 一 个 令 人 难以 置信 的 项 目 ， 将 真正 
考验 你 的 能 力 ， 使 用 之 前 学 过 的 基础 技术 来 实现 它 。 如 果 你 做 了 这 一 
步 ， 那 么 你 已 经 掌握 了 大 量 必 备 的 编程 和 计算 机 科学 基本 概念 。 具 体 
来 说 ， 你 掌握 了 计算 机 程序 的 最 重要 元 素 (WRif-elseiBA, MM, 
=, WR, MA, RAS) ， 你 已 经 学 会 了 链 式 或 树 型 的 数据 结构 。 
这 时 ， 无 疑 你 已 经 准备 好 转移 到 更 高 级 的 主题 。 


8.4 本 章 小 结 


本 章 是 针对 前 面 各 个 章节 没有 提 到 的 一 些 性 能 优化 建议 、 全 局 性 
建议 的 补充 。 首 先 针对 Web 应 用 、Web 容 器 的 性 能 优化 提出 自己 的 建 
议 ， 然 后 讲解 了 一 些 数 据 库 应 用 方面 的 优化 建议 ， 接 下 来 对 企业 级 应 
用 和 系统 整体 架构 方面 的 优化 提出 自己 的 看 法 ， 最 后 是 一 些 与 个 人 品 
质 、 思 维 方式 相关 的 建议 。 通 过 本 章 的 分 享 ， 全 书 完成 了 所 有 与 Java 程 
序 相关 的 知识 分 享 ， 希 望 读者 能 够 受益 。 


[1] 面向 服务 的 体系 结构 是 一 个 组 件 模型 ， 它 将 应 用 程序 的 不 同 功能 单元 ( 称 为 服务 ) 通过 这 些 服务 之 间 定 义 良好 的 接口 
和 契约 联系 起 来 。 


[2]2 Google (中 文 名 : 谷歌 ) ， 是 一 家 美国 的 跨国 科技 企业 ， 致 力 于 互联 网 搜索 、 云 计算 、 广 告 技术 等 领域 ， 开 发 并 提供 
大 量 基于 互联 网 的 产品 与 服务 ， 其 主要 利润 来 自 于 AdWords 等 广告 服务 。 


[3]3 Android 是 一 种 基于 Linux 的 自由 及 开放 源 代码 的 操作 系统 ， 主 要 使 用 于 移动 设备 ， 如 智能 手机 和 平板 电脑 ， 由 
Google 公 司 和 开放 手机 联盟 领导 及 开发 。 


[4]4 通过 接口 可 以 让 两 个 不 想 关 的 软件 服务 互相 访问 对 方 。 
[5]5 OpenJDK9 12 月 10 日 完成 属性 开发 ，Oracle JDK 预 计 2016 年 3 月 对 外 发 布 。 
[616 即 Java 模 块 化 系统 需求 。 


[717 JCP (Java Community Process) 是 一 个 开放 的 国际 组 织 ， 主 要 由 Java 开 发 者 以 及 被 授权 者 组 成 ， 职 能 是 发 展 和 更 
新 。 


[8]8 篇 姆 斯 -高 斯 林 (James Gosling，1955 年 5 月 19 日 -， 出 生 于 加 拿 大 ) ， 软 件 专家 ，Java 编 程 语言 的 共同 创始 人 之 一 ， 
一 般 公认 他 为 “Java 之 父 ”。 

[9]9 帕特里克 .诺顿 (Patrick Naughton) 诺顿 是 Sun Java 项 目的 中 坚 人 物 ， 并 曾 在 迪士尼 担任 互联 网 业务 高 管 。 

[10] 卡 内 基 梅 隆 大 学 计算 机 科学 专业 博士 ，Google 的 Java 首 席 架 构 师 。 


[11] 函数 式 编程 是 种 编程 典范 ， 它 将 电脑 运算 视 为 函数 的 计算 。 函 数 编程 语言 最 重要 的 基础 是 演算 (lambda 
calculus) 。 而 且 和 演算 的 函数 可 以 接受 函数 当 作 输 入 (参数 ) 和 输出 (返回 值 ) 。 和 指令 式 编程 相 比 ， 函 数 式 编程 强调 函 


数 的 计算 比 指令 的 执行 重要 。 和 过 程 化 编程 相 比 ， 函 数 式 编程 里 ， 函 数 的 计算 可 随时 调用 。 


[12] 一 种 基于 JVM (Java 虚拟 机 ) 的 敏捷 开发 语言 ， 它 结合 了 Python、Ruby 和 Smalltalk 的 许多 强大 的 特性 ，Groovy fX 
码 能 够 与 Java 代码 很 好 地 结合 ， 也 能 用 于 扩展 现 有 代码 。 由 于 其 运行 在 JVM 上 的 特性 ，Groovy 可 以 使 用 其 他 Java 语 
言 编写 的 库 。 


[13] 一 门 多 范式 的 编程 语言 ， 一 种 类 似 Java 的 编程 语言 ， 设 计 初 囊 是 实现 可 伸缩 的 语言 、 并 集成 面向 对 象 编程 和 函数 式 编 
程 的 各 种 特性 。 


[14] 一 个 采用 纯 Java 实 现 的 Ruby 解 释 器 ， 由 JRuby 团 队 开 发 。 它 是 一 个 自由 软件 ， 在 CPL/GPL/LGPL 三 种 许可 协议 下 发 
布 。 


[15] 谷歌 2009 发 布 的 第 二 款 开源 编程 语言 。Go 语 言 专门 针对 多 处 理 器 系统 应 用 程序 的 编程 进行 了 优化 ， 使 用 Go 编译 的 程 
序 可 以 媳 美 C 或 C++ 代码 的 速度 ， 而 且 更 加 安全 、 支 持 并 行进 程 。 


[16] 一 个 开源 的 应 用 容器 引擎 ， 让 开发 者 可 以 打包 他 们 的 应 用 以 及 依赖 包 到 一 个 可 移植 的 容器 中 ， 然 后 发 布 到 任何 流行 的 
Linux 机 器 上 ， 也 可 以 实现 虚拟 化 。 


[17] 一 种 为 简单 快捷 的 面向 对 象 编程 (面向 对 象 程序 设计 ) 而 创 的 脚本 语言 。 
[18] 一 种 面向 对 象 、 解 释 型 计算 机 程序 设计 语言 。 


[19] Node.js 是 一 个 基于 Chrome JavaScript 运 行 时 建立 的 平台 ， 用 于 方便 地 搭建 响应 速度 快 、 易 于 扩展 的 网 络 应 用 。 
Node.js 使 用 事件 驱动 ， 非 阻塞 I/O 模型 而 得 以 轻 量 和 高 效 ， 非 常 适合 在 分 布 式 设备 上 运行 的 数据 密集 型 的 实时 应 用 。 


[20] 世界 上 第 一 个 真正 的 Ajax 服 务 器 ， 服 务 器 端 和 客户 端 都 是 使 用 JavaScript， 而 且 可 以 相互 调用 。 
[21] 一 种 基于 Java 的 build 工 具 。 理 论 上 来 说 ， 它 有 些 类 似 于 (UNIX) C 中 的 make， 但 没有 make 的 缺陷 。 
[22] 基于 项 目 对 象 模型 (POM) ， 可 以 通过 一 小 段 描述 信息 来 管理 项 目的 构建 ， 报 告 和 文档 的 软件 项 目 管理 工具 。 


[23] Google 开 源 的 容器 集群 管理 系统 。 它 构建 Ddocker 技 术 之 上 ， 为 容器 化 的 应 用 提供 资源 调度 、 部 署 运 行 、 服 务 发 现 、 
扩容 缩 容 等 整 一 套 功 能 ， 本 质 上 可 看 作 是 基于 容器 技术 的 mini-PaaS 平 台 。 


[24] Mozilla 开 发 的 注重 安全 、 性 能 和 并 发 性 的 编程 语言 。 


[25] JDBC (Java Data Base Connectivity，java 数 据 库 连接 ) 是 一 种 用 于 执行 SQL 语句 的 Java API， 可 以 为 多 种 关系 数据 
库 提供 统一 访问 ， 它 由 一 组 用 Java 语 言 编 写 的 类 和 接口 组 成 。 


